Saltar al contenido

Cómo funciona el algoritmo de búsqueda de Google. Destripando Google

enero 4, 2018

Este artículo es uno de los más complejos que jamás he hecho en toda mi existencia. No solo por la longitud del mismo, sino por la cantidad de conocimiento que se plasman en el mismo. No obstante, intentaré ser lo más preciso y a la vez claro que pueda, para que todos, cuando salgamos de este artículo, sepamos en resumidas cuentas cómo funciona Google.

Antes de nada, quiero que os deis cuenta de la magnitud de la que hablamos cuando decimos que Google es el buscador con más importancia de todo el mundo. Sin embargo, como muchos sabréis, Google es mucho más que un buscador, es un calendario, un servicio de almacenamiento en la nube, un gestor de correo electrónico, una plataforma de vídeo y un largo etcétera más que podría comentar en otros artículos si así queréis. Para empezar, el dominio google.com es el más visitado en las listas de todo el mundo y en la de los respectivos países. Para que os hagáis una idea, cuenta con unas 43 mil millones de visitas mensuales, un porcentaje de rebote del 46% y una duración media de visita de 7 minutos y medio. Si estas cifras no os alucinan, yo ya no sé qué hacer.

popularidad de google
Google se corona en el top mundial de páginas visitadas

El rastreo e indexación de webs

Nos encontramos en el primer paso de todos, la recopilación de todas las páginas y todas las webs que Google irá incluyendo en su larga base de datos. Para ello utilizará lo que muchos conocer como Googlebot o como la araña de Google. Su función en un principio parece sencilla, pero no lo es. La araña pasa por todas las webs existentes en un plazo de tiempo que se decide como oportuno y va recopilando información sobre urls, palabras clave, enlaces, etc. No nos olvidemos recordar, que Google va más allá, también hace análisis de imágenes, vídeos, noticias y productos, para luego mostrarlos en su correspondiente sección en la búsqueda.

Cuando Googlebot capta un enlace, lo sigue para ver hasta donde llega y por lo tanto analizar la página de llegada. Por esta misma razón, un buen consejo para que Google analice vuestra nueva página web, es colocar enlaces externos desde páginas que ya tengan una cierta reputación. Los enlaces no tienen porque llevar a alguna web, sino que se pueden tratar de enlaces inactivos o “rotos” que no llevan a ninguna parte y que Google claramente resta importancia a dicha página web.

Dos elementos clave que se utilizan para el rastreo y la indexación de páginas web son los robots y el sitemap. Si sois webmasters, posiblemente ya habréis oido escuchar sobre el sitemap o mapa del sitio. Es un esquema donde se muestra la organización de todos los archivos, páginas y entradas y al cual debemos de darle a Google acceso. Para ello, sobrará con incluirlo dentro de la Google Search Console. El archivo robots.txt, es bastante más complejo de explicar. En él los desarrolladores de webs pueden indicar si quieren que su página se indexe o especificar que elementos queremos que sí aparezcan en las búsquedas y cuáles no.

Hasta hace unos años, todo terminaba aquí, pero ahora con la llegada de los fragmentos y datos estructurados, el análisis de las búsquedas va más allá. Para empezar, Googlebot analiza si hay alguno de estos elementos en tu página web y en caso de ser así lo almacena en su base de datos. No es hasta el momento de la búsqueda cuando decide, según el usuario que la esté realizando, si lo incluye al inicio de la misma o no.

araña de google

Algoritmos y la red neuronal de Google

Hemos hecho ya el trabajo más sencillo, hemos logrado recabar información sobre todos los sitios y páginas web del mundo. ¿Cuánto esfuerzo no? Eso parece, pero la fiesta solo acaba de empezar, ahora toca organizar todos esos datos y decidir cuáles mostrar primero y cuáles después. Esto sería pan comido si solo hubiesen 100 contenidos relacionados con la búsqueda que acabas de realizar, pero no es así. Entonces, cómo es que Google sabe que mostrarte de entre 343.000.000 resultados y sobre todo, ¿cómo lo hace en 0,63 segundos?

Bueno, antes de nada tenemos que ver que es lo que Google tiene en cuenta para mostrarte lo las búsquedas. No se conoce el número exacto, pero según su web oficial se trata de más de 200 variables distintas. Dando valores a estas variables y metiéndolas en un algoritmo bien precioso y extenso se obtiene una puntuación a la que se la conoce como pagerank. A parte de esta puntuación, Google tiene en cuenta otros aspectos que nada tienen que ver con el artículo, sino contigo. Entre ellos encontramos tu idioma, tu localización o la fecha en la que estés. Claramente, aunque una web inglesa que hable sobre “pollo” tenga un pagerank muy alto, a ti que hablas español, no te la va a mostrar a no ser que sea estrictamente necesario y no haya otra alternativa.

¿Cuál es el algoritmo de Google? Tranquilo, si lo supiera no estaría aquí, estaría posicionando páginas justo como Google quiere, apareciendo siempre en primera posición y por lo tanto hinchándome a ganar dinero. Así que cuidado con aquellos que dicen que se conocen el algoritmo de Google y que te venden el libro definitivo para posicionar en buscadores, porque se pilla antes a un mentiroso que a un cojo. No obstante, existe un proceso por el cual podemos posicionar páginas web denominado SEO, pero que no solo se basa en aplicar lo sabido, sino en probar, probar y probar hasta conocer qué es lo que funciona y lo que no. De todas formas, no te preocupes si no eres SEO, Google ya ha pensado en ello y por esa razón su tendencia en cada actualización de algoritmo es acercarse cada vez más a la naturalidad y no al SEO forzado que podemos ver hoy día en muchas webs.

¿Cuál es la manera de funcionar de Google?

busqueda google

Bueno, ya sabemos qué es el pagerank y que no es posible conocer el algoritmo de Google al completo. Sin embargo, si conocemos como es este proceso de selección de calidad que se lleva a cabo en Google y que sin saberlo nosotros también formamos parte. Se basa de los siguientes 4 pasos y aunque parezcan muy extensos, los cambios en el algoritmo desde que un ingeniero tiene una idea hasta que se implementa definitivamente en el buscador pueden darse en solo 24 horas. A esta velocidad, en 2011 se realizaron 538 modificaciones.

  1. Cuando un ingeniero tiene una idea, inicia una fase de prueba que se les ofrece a los evaluadores. Estas personas se encargan de analizar los datos que se obtienen de una búsqueda con estos nuevos cambios y dan su opinión sobre la utilidad de los resultados obtenidos por el nuevo algoritmo. En el año 2011, se realizó este proceso 41831 veces, se dice pronto.
  2. Una vez que los evaluadores les dan el visto bueno, las pruebas llegan a una segunda fase denominada experimentos paralelos. En este momento los evaluadores se enfrentan a dos versiones de una búsqueda concreta, una de ellas con el algoritmo original y otra con el algoritmo modificado. En el año 2011, pasaron por esta tarea 9250 algoritmos.
  3. El paso tres son los experimentos de tráfico en tiempo real. Estas modificaciones del algoritmo son implantadas para un número reducido de usuarios reales y en base a su comportamiento se decide si implantar los cambios en el algoritmo original o no.

Después de todos estos pasos, y como os hemos comentado antes, solo 538 (1,2%) cambios son capaces de pasar todos los requisitos y colocarse finalmente en el buscador. No obstante, estamos hablando de más de un cambio por día, así ya os podéis imaginar lo rápido que puede cambiar el algoritmo de Google y las estrategias de posicionamiento.