Hace un tiempo explicaba en mi blog qué es el SEO, para todo aquel que empieza a hacerse preguntas acerca de cómo posicionar su web en buscadores. Bien, hoy quiero ir un paso más allá contando, lo más detalladamente posible, cuál es el proceso para que una página web aparezca en un motor de búsquedas como Google.
Para mucha gente Google es sinónimo de Internet, algo que se debe a la evolución de la manera de navegar de los usuarios por la red. Aunque parezca mentira, antes de que el uso de buscadores como Yahoo y Google se extendiera, la gente se aprendía las direcciones web para acceder a ellas. Actualmente los usuarios se van directamente al buscador e introducen una consulta para obtener lo que están buscando.
Pero para que una página web aparezca en los resultados de dicha consulta, antes tiene que pasar por las 3 fases que los motores de búsqueda llevan a cabo: crawling (rastreo), indexing (indizado) y ranking (clasificación). Veamos en qué consisten cada una de estas fases.
Crawling (Rastreo)
Para el rastreo, los motores de búsqueda cuentan con los llamados “bots” (robots), que son programas informáticos que peinan el World Wide Web para encontrar nuevos contenidos que ofrecer a los usuarios. ¿Cómo hacen esto?
Te explico, a partir de enlaces estos robots van descubriendo todo el contenido del sitio web enlazado. De manera que por cada enlace descubierto (ojo, todo lo que tenga pinta de enlace lo tratan como tal) se realiza el siguiente proceso:
- Leen todo el contenido de la página en concreto.
- Recopilan todos los enlaces de dicha página.
- Planifican nuevas operaciones de rastreo para las páginas a las que apuntan dichos enlaces.
Este proceso lo realiza de manera recursiva, es decir, va recuperando la información de cada web y a su vez la de todas las webs a las que enlaza (siempre y cuando no se encuentre en el camino el atributo “nofollow” o cualquier otro impedimento para examinar la web), y esto se hace de manera indefinida. El objetivo final es localizar todo el contenido posible y recuperarlo de la manera más óptima en su propio sistema, para mostrárselo posteriormente al usuario.
Lo mejor de todo, es que cuando termina de examinar todas las páginas, vuelve al principio para examinarlas nuevamente, por si hay contenido fresco. Hace algunos años, Googlebot examinaba nuestra página cada X semanas, pero dada la frescura que caracteriza actualmente a Internet, los motores de búsqueda han mejorado sus recursos para conseguir que este proceso se realice continuamente. Hoy por hoy tu web puede ser examinada nuevamente en cuestión de unas horas gracias a la potencia de hardware con el que cuentan. Además, los índices se actualizan tan pronto como se rastrea una página (desde Google Caffeine).
Indexing (Indizado)
La siguiente fase sería la de indizado (indexing) que consiste en la creación de un índice de contenidos que permita acceder al contenido esperado de una manera eficiente. Así una vez que los robots de rastreo van descubriendo nuevos contenidos, estos se van copiando (sólo los de las páginas permitidas a través del archivo robots.txt) y quedan organizados en estos índices. Desde Google Caffeine, este proceso se realiza de manera simultánea en lugar de ser dos fases diferentes.
Los recursos textuales de las páginas web son fundamentales en este proceso ya que servirán para buscar coincidencias con las palabras introducidas en el buscador, cuando se realice el proceso de ranking.
Ranking (Clasificación)
Pasamos ya a la fase más polémica que lleva a cabo todo motor de búsquedas, la de clasificación de los resultados para el usuario (ranking). Digo polémica porque siempre es posible encontrar en los primeros resultados páginas que no se consideran precisamente las “mejores” para devolver en una consulta de búsqueda. Estas webs se aprovechan de los posibles puntos débiles de un motor de búsquedas que tiene que procesar más de 20 billones de sitios web con sus respectivas páginas interiores, para infinitas variaciones de los términos buscados por los usuarios.
Vamos al grano, en esta fase el objetivo es ordenar los índices de páginas web en base a la relevancia que pueden tener para el usuario, ¿no es así? Bien, ¿cómo hace esto un motor de búsquedas como Google?
Lo primero que hay que decir, es que para esta clasificación se toma como base el algoritmo PageRank, que obviamente ha evolucionado muchísimo desde su nacimiento, pero servirá para explicar qué tiene en cuenta Google a la hora de mostrar mi página web.
¿Qué es el PageRank?
El PageRank fue ideado por Larry Page y Sergey Brin, tomando como referencia los sistemas de ranking de publicaciones científicas, en las que los autores más importantes son los citados por otros compañeros de su campo.
Con este punto de partida, nos encontramos con un escenario en el que una página web es más relevante si tiene un gran volumen de enlaces desde otras páginas (ha sido muy referenciada). Bueno, con matices. Porque actualmente lo más relevante no es el número de enlaces sino que estos enlaces sean de calidad. ¿Qué quiere decir calidad? Pues básicamente que los enlaces sean naturales (no conseguidos haciendo spam u otras prácticas fraudulentas), que estos sean en su mayoría procedentes de páginas del sector, que estos tengan a su vez una cierta reputación…etc. Lógicamente cuantos más enlaces de calidad mejor, más posibilidades de ganar a los que compiten por las posiciones principales, pero la cantidad ya no es un factor clave.
¿Cómo ordena Google los resultados?
Para ordenar los resultados de una búsqueda, además de los enlaces entrantes, Google tiene en cuenta otros muchos factores que no se derivan directamente del llamado PageRank que acabamos de ver. Factores que tienen que ver la relación de las palabras clave con la consulta de búsqueda son determinantes.
Por ejemplo, si buscamos “comprar ropa online”, el motor de búsqueda se quedará de sus índices con las páginas que tengan esas 3 palabras en elementos importantes de la web como son el título, la dirección web, la descripción, la cabecera…etc. Dará prioridad a páginas web con mejor perfil de enlaces entrantes. Y por supuesto esta valoración también depende de otros factores que Google ha ido añadiendo (son más de 200).
Así que, a partir de ahora, cada vez que te hagas la pregunta “cómo posicionar mi web”, echa un vistazo al proceso que seguirá tu página y contribuye a optimizarlo.
Hola Luis
¿En base a la importancia de nuestra web a ojos de Google es que nos asignan un crawl budget?
¿O depende del tráfico?
Saludos desde Caracas