Rankbrain y Google Algorithm: últimos desarrollos

L’objectif de Google est de répondre aux internautes, à ses usages (utilisation du mobile, recherches locales ou vocales…) et à ses intentions de recherche : informationnelles ou transactionnelles.

El desafío técnico de Google también es el de apoyar, organizar y priorizar una serie de páginas que están creciendo exponencialmente.

Quand on fait appel à un consultant seo, faut il suivre les mises à jour de Google ?

Un bon consultant a normalement déjà anticipé les mises à jour futures et respecter les standards attendus.  Il va en revanche mesurer les impactes et adopter des actions si besoin.

Machine Learning, el algoritmo que aprende constantemente

El aprendizaje automático es una aplicación de inteligencia artificial (IA) que permite a los sistemas aprender y mejorar automáticamente a partir de la experiencia sin estar programados explícitamente.

Esto significa que se mide e interpreta el comportamiento de los internautas : CTR, pogostiking, tiempo de permanencia… estos elementos constituyen el enfoque SXO .

El aprendizaje automático se centra en el desarrollo de programas informáticos que pueden acceder a los datos y utilizarlos para aprender por sí mismos.

¿Cuáles son las ventajas del aprendizaje automático en la programación informática?

Ver la respuesta de Google

 

1. Las diferentes evoluciones de Google

Los algoritmos de Google deciden si su sitio web, incluidas las publicaciones de su blog, ocupará el primer lugar o el último lugar en los resultados de búsqueda. Pueden hacer que su negocio prospere o exponerlo a un riesgo financiero significativo si se penaliza su cotización.

 

Las diversas actualizaciones del algoritmo de Google clasificadas por fecha de implementación desde 2010 son:

  • Cafeína
  • Panda
  • Top pesado
  • Pingüino
  • Pirata
  • Dominio de coincidencia exacta (EMD)
  • Día de paga
  • Colibrí - Colibri
  • Paloma
  • Compatible con dispositivos móviles
  • RankBrain
  • Fantasma (o calidad)
  • Google duplica la longitud de las descripciones
  • Actualización básica de agosto de 2018
  • Actualización básica de junio de 2019
  • Actualización de la diversidad del sitio
  • Actualización básica de septiembre de 2019
  • Bert

A continuación se muestra información sobre los algoritmos de Google porque la totalidad de los algoritmos es demasiado secreto.

Sin embargo, algunas partes del algoritmo de Google se actualizan periódicamente. Además, conocerlas permite adquirir una visión global del SEO, analizar el impacto que tienen algunas de estas actualizaciones y, quizás, también entender un poco mejor lo que realmente quiere decir el webmaster o el experto en SEO cuando se trata de pingüinos o pandas. Además, puede sorprender a más de uno, pero el ranking de Google no se basa en un solo algoritmo. En realidad, varios algoritmos funcionan en paralelo.

2. Acontecimientos históricos

a. Cafeína

algoritmo de cafeína

Implementado en junio de 2010 , Caffeine es un rediseño del sistema de indexación de Google. El algoritmo de cafeína le permite rastrear y luego indexar una página al instante. Antes de su implementación, Google solo podía indexar páginas después de extraer, analizar y comprender su contenido. Un proceso que puede tardar hasta 30 días.

De hecho, Carrie Grimes, ingeniera de software de Google, nos dice en un artículo que el índice antiguo se basaba en diferentes capas que no se actualizaban simultáneamente. Esto provocó retrasos entre el descubrimiento de una nueva página y su presentación en los resultados de búsqueda. El nuevo índice de búsqueda rastrea la web en pequeñas porciones y permite agregar de manera constante nuevos recursos sin el uso de capas.

Gracias a este nuevo sistema que facilita y aumenta la velocidad de indexación, Google ahora puede ofrecer en sus resultados de búsqueda contenido y artículos un 50% más recientes que antes la implementación del algoritmo.

Impacto de la cafeína en el SEO

Oficialmente, dado que la cafeína no es una modificación del algoritmo del motor de búsqueda, no tiene impacto en el SEO. Sin embargo, cuando los datos se indexan más rápido y en otra forma, la presentación de los resultados de búsqueda cambia y con ello la ubicación de los sitios web en las SERP.

Ver más sobre cafeína

segundo. Pandas

algo google panda

El algoritmo Panda es un "filtro de búsqueda". Introducido por primera vez en febrero de 2011 , penaliza la referencia a sitios web con contenido de baja calidad. Este filtro está destinado principalmente a combatir los sitios de contenido, creados exclusivamente para SEO y spam.

El algoritmo de Panda se actualiza periódicamente para permitir que los sitios previamente penalizados recuperen su SEO tras mejorar la calidad de su contenido, o por el contrario, penalizar a los sitios que ya no cumplen con las pautas de Google. Durante su primera implementación, Panda tuvo un gran impacto en la configuración de los resultados de búsqueda al alterar el 12% de las SERP en los Estados Unidos.

Después de la actualización 4.2 del 18 de julio de 2015, la calidad del contenido se convirtió en un factor de SEO y la integración de Panda en el algoritmo principal de Google se confirmó en enero de 2016. Por lo tanto, Google ya no anuncia las actualizaciones. Actualización de Panda: este algoritmo se tiene en cuenta constantemente para definir el ranking de un sitio web en las páginas de resultados de búsqueda.

Impacto de los pandas en el SEO

Algunas categorías de sitios que se han visto muy afectados por el filtro Panda:

  • Comparación de precios
  • Directorio de empresas
  • Listado de comerciantes (hoteles, eventos, restaurantes)

C. Top pesado

El algoritmo Top Heavy se implementó en enero de 2012 , con el fin de penalizar la referencia a sitios sobrecargados anormalmente con anuncios, en particular por encima de una determinada línea.

Sin embargo, esta pequeña actualización solo tuvo un impacto del 1% en los resultados de búsqueda.

Lee mas

re. Pingüino

El algoritmo Penguin es la bestia negra de los webmasters, cada actualización de la cual fue muy discutida en la web y provocó oleadas de pánico y cuestionamientos en las redes sociales. Los expertos podrán confirmarlo: con cada fluctuación de los SERPs, la comunidad SEO entró en pánico al temer un nuevo cambio en el algoritmo de Google debido a Penguin.

Como Panda, este algoritmo es un filtro de búsqueda que se introdujo por primera vez en abril de 2012 . Penaliza la referenciación de sitios web que no respetan las pautas de Google para crear, comprar o establecer vínculos en red.

Los webmasters sancionados por Penguin tuvieron que limpiar su portafolio de enlaces desautorizando los enlaces ofensivos. Si esta limpieza se realizó correctamente, podrían esperar recuperar su SEO original en la próxima actualización. Sin embargo, esta tediosa limpieza no es tan simple: a veces pueden pasar meses o incluso años antes de que pueda esperar escapar de las sanciones de SEO de Google.

El 23 de septiembre de 2016 , durante el lanzamiento de la Actualización 4.0 , Google anunció que esta sería la última. Al igual que Panda, el algoritmo Penguin se ha agregado al algoritmo central de Google y ahora funciona en tiempo real.

Por lo tanto, monitorear la cartera de enlaces debe ser un trabajo constante para garantizar una cartera de enlaces saludable, que no corre el riesgo de penalizar el SEO de ciertas páginas.

Además, la incorporación al algoritmo central de Google es una buena noticia, ya que los webmasters no tendrán que esperar una nueva actualización para recuperar su SEO. De hecho, han pasado casi dos años entre la penúltima actualización del algoritmo y el despliegue de la versión 4.0 de Penguin.

Lee mas

mi. Pirata

El algoritmo Pirate es un filtro de búsqueda implementado en agosto de 2012 . Su objetivo es eliminar de los sitios SERP que han recibido quejas de infracción de derechos de autor enviadas a través del sistema DMCA de Google.

Este filtro se actualiza periódicamente para eliminar las páginas que ofrecen descargas ilegales de películas, series o música.

F. Dominio de coincidencia exacta (EMD)

El algoritmo Exact Match Domain se implementó en septiembre de 2012 . Evita que se haga referencia a sitios de baja calidad en los primeros resultados de búsqueda, simplemente porque su nombre de dominio corresponde a una consulta muy buscada por los usuarios de Internet.

De hecho, el nombre de dominio tiene una gran influencia en el SEO y algunos webmasters han encontrado una forma de mejorar su SEO creando nombres de dominio demasiado optimizados.

Por ejemplo, antes de la implementación de este algoritmo, tomando "www.logiciel-marketing-pas-cher.com" como nombre de dominio, existía una buena probabilidad de que se hiciera referencia a la página de inicio de este sitio web. en los primeros resultados de búsqueda de la consulta "Software de marketing barato", incluso si el contenido de sus páginas no necesariamente satisfacía las necesidades de los usuarios de Internet. El despliegue de este algoritmo permitió evitar tales situaciones.

gramo. Día de paga

Este algoritmo se implementó en junio de 2013 . Su objetivo es mejorar la relevancia de las SERPs suprimiendo los resultados de las solicitudes muy asimiladas al spam (sitios de juegos en línea, contenido para adultos, créditos, falsificaciones, etc.).

h. Colibrí (Colibri en francés)

Hummingbird se desplegó en septiembre de 2013 . Este algoritmo es uno de los más importantes de Google. Ha tenido un fuerte impacto en la forma en que enmarcamos nuestra investigación. Google eligió nombrar este algoritmo Hummingbird porque, gracias a él, la búsqueda se volvió precisa y rápida.

Gracias a este algoritmo, Google ahora puede entender una consulta o una frase como un todo y ya no se basa en una o pocas palabras clave. Por lo tanto, los resultados propuestos son de mucha mejor calidad y la investigación podría volverse más humana, gracias a la comprensión de la investigación conversacional.

Desde la implementación del nuevo algoritmo, es posible obtener respuestas precisas para consultas como: "¿Cuál es la panadería más cercana?" O "¿Quién es el médico de guardia hoy?". Este tipo de investigación era impensable antes ... ¿Hummingbird habría abierto la puerta a inteligencias artificiales y asistentes de voz como Alexa o Siri? Más adelante veremos que esta actualización contiene la inteligencia artificial de google que ha optimizado por completo la forma de entender las solicitudes de google (cosas, no cadenas).

Lee mas…

yo. Paloma

El algoritmo Pigeon se implementó en julio de 2014 en los Estados Unidos y en junio de 2015 a nivel internacional. Este algoritmo favorece los resultados de la búsqueda local para brindar soluciones más precisas a las consultas de los usuarios. Los cambios realizados por este algoritmo son visibles en Google y Google Maps.

El algoritmo Pigeon ha impactado sobre todo en comercios y comercios locales como restaurantes, bares o consultorios médicos ...

j. Compatible con dispositivos móviles

El 21 de abril de 2015 , Google lanzó su algoritmo Mobile Friendly, que favorece la referencia a sitios web compatibles con dispositivos móviles.

Este algoritmo tuvo un impacto aún mayor que los de Penguin o Panda e incluso fue rebautizado como "mobilegeddon" (en referencia al armageddon) por algunos expertos en SEO: el Armageddon de la compatibilidad móvil.

Este algoritmo se implementó en tiempo real y página por página. Por lo tanto, un sitio podría mantener una buena clasificación general, incluso si algunas de sus páginas no estaban adaptadas al formato móvil.

Desde 2015, la compatibilidad móvil ha sido una prioridad para Google y un factor SEO muy importante. Además, en noviembre de 2016 , Google anunció que lanzaría su Mobile First Index en el transcurso de 2017.

¿Qué es Mobile First Index? Hasta ahora, Google clasificaba los sitios web según su versión de escritorio. Pero el comportamiento de los usuarios está cambiando y pasan más tiempo navegando por Internet en un dispositivo móvil que en una computadora. Por tanto, Google ha decidido tener en cuenta la versión móvil de un sitio web, en detrimento de la versión de escritorio, para realizar su referenciación.

k. RankBrain

Rankbrain, lanzado a principios de 2015 , es en realidad parte del algoritmo de búsqueda Hummingbird. Rankbrain es bastante peculiar y misterioso, ya que se dice que es una inteligencia artificial que podría comprender el significado de solicitudes similares, pero formuladas de manera diferente.

Por ejemplo, esta inteligencia artificial podría entender, en el transcurso de su aprendizaje, que las consultas "Barack" y "El marido de Michelle Obama" deben dar una respuesta similar a la de "Barack Obama".

En la extensión de Hummingbird, Rankbrain tiene como objetivo interpretar y comprender las investigaciones más abstractas de los usuarios de Internet. Más importante aún, Google afirmó que Rankbrain estaba entre los tres principales factores de SEO (junto con la calidad del contenido y los enlaces).

El aprendizaje de Rankbrain se aplica a todas las investigaciones, pero se realiza sin conexión. Google lo alimenta con archivos de investigación histórica para que aprenda a hacer predicciones. Estas predicciones se prueban y luego se aplican, si resultan ser correctas.

Se dedicará un capítulo completo a Rankbrain en la secuela. Veremos en detalle qué es realmente, cómo funciona, etc.

l. Fantasma (o calidad)

En mayo de 2015 , el planeta SEO entró en pánico, ya que muchos webmasters notaron cambios significativos en las SERP. Sin embargo, cuando los miembros del equipo de Google, a cargo de la calidad de los buscadores, fueron interrogados en Twitter (como suele ser el caso), respondieron que no tenían ningún interés. actualizado por anunciar.

Los webmasters, convencidos de que algo estaba pasando, decidieron nombrar esta actualización como Phantom, debido a que no había respuesta de Google, pero sí claras señales de cambio.

Unas semanas más tarde, Google confirmó que efectivamente se había implementado una actualización y que estaba relacionada con la calidad del contenido de los sitios web. Google cambió el nombre de la actualización Phantom a "Calidad". Sin embargo, Google nunca quiso aclarar en qué se diferenciaba esta actualización del algoritmo Panda.

Periódicamente, los expertos en SEO notan actualizaciones, pero Google las niega. Existen pues varias versiones del algoritmo Phantom, bautizado a falta de un nombre mejor, por Phantom 1, 2 o 3. Sin embargo, su importancia, sus mecanismos y su alcance siguen siendo más o menos desconocidos.

señor. Google duplica la longitud de las descripciones

En noviembre de 2017 , Google duplicó la cantidad de caracteres que se muestran en las descripciones de los resultados de un límite de 160 caracteres a un límite de 320 caracteres.

Con esta actualización, Google sigue favoreciendo frases completas y descripciones que contienen información suficiente para dar contexto al enlace, con el fin de orientar mejor al internauta en sus búsquedas. Por lo tanto, es posible que el motor de búsqueda ignore su etiqueta de metadescripción y corte o complemente ciertas descripciones.

Recordatorio: las meta descripciones no cuentan en las clasificaciones de los motores de búsqueda, pero siguen siendo esenciales para alentar a sus visitantes a visitar su sitio.

norte. Actualización básica de agosto de 2018

Lanzada el 1 de agosto de 2018 a mediados del verano, esta actualización básica también se llama "Actualización médica", por varias razones. Se trata de un formato de actualización de algoritmo general, cuyas modificaciones pueden ser más o menos importantes en función de los puntos que procesa / optimiza.

Aquí, Google no ha dado indicaciones más precisas sobre lo que se ha llevado al motor. El único comunicado de prensa sobre este tema menciona el hecho de seguir el mismo consejo genérico que en la anterior Core Update de marzo de 2018. Varios especialistas han estudiado la cuestión de esta actualización, debido a que el ranking se ha modificado mucho para varios sitios. , principalmente en:

  • Salud en la gran mayoría.
  • Finanzas y negocios.
  • El sector del comercio electrónico.

Más tarde, Google afirmó que esta actualización principal no solo concierne a las páginas de YMYL (Your Money Your Life) y los temas mencionados anteriormente, sugiriendo que de hecho concierne a todos.

o. Actualización básica de junio de 2019

Una nueva gran actualización del algoritmo, la de junio de 2019, es más precisamente la primera que se ha anunciado oficialmente a los especialistas a través de un tweet en Twitter. De hecho, este cambio en el motor de búsqueda se hizo efectivo el 3 de junio de 2019 .

Se trata de una actualización cuyo objetivo es fortalecer los requisitos en términos de calidad general en cuanto a los resultados mostrados en los SERP, en particular en los siguientes puntos:

  • Velocidad de carga y navegación fluida.
  • Cobertura global y relevante del tema en cuestión.
  • Cambiar a HTTPS oa un diseño de respuesta completa UX / UI.

Esta actualización fue otro hito en la exhibición de contenido de publicación de blog de calidad. Los sitios de mala calidad ahora ven su clasificación general disminuyendo a favor de los sitios de alto rendimiento, regularmente alimentados con contenido de calidad bien construido que siempre responde a la solicitud del usuario de Internet.

Por otro lado, esta actualización se diferencia por su revalorización en las SERPs de las sugerencias de videos de YouTube sobre los resultados de búsqueda.

pags. Actualización del núcleo de diversidad del sitio

Esta actualización de algoritmo se anunció muy poco después de la actualización principal de junio de 2019 y también se lanzó durante ese mismo mes de junio de 2019 . Su nombre explica el principio mismo de las nuevas reglas que trae: reforzar la diversidad de resultados en las páginas de búsqueda.

De hecho, esta actualización limita mucho la posibilidad de tener varias páginas del mismo dominio en los primeros resultados de búsqueda. Así, sin dejarlo claro, Google promueve la competencia entre sitios, pero también facilita el cotejo de fuentes de particulares para obtener información cada vez más fiable.

Por tanto, este último punto debería estar vinculado a los criterios de selección de ranking de las dos actualizaciones anteriores:

  • Un sitio con contenido estructurado, relevante y confiable.
  • Una experiencia de navegación óptima (velocidad de carga, etc.).
  • Una estructura de árbol del sitio coherente e intuitiva.

Con todos estos elementos, Google definitivamente entierra técnicas de competencia más o menos leales, como las portadas. Este método consistía en construir una página solo para atraer tráfico de una sola palabra clave o consulta.

q. Actualización básica de septiembre de 2019

Menos impactante que sus predecesores, este cambio en el motor se anunció con más precisión en el Twitter dedicado de Google el 24 de septiembre de 2019 .

Entre las principales fluctuaciones en el posicionamiento, se han observado cambios en sitios que solían estar peor clasificados. En otras palabras, esta actualización es una revalorización de los resultados que anteriormente se limitaban a clasificaciones bajas en las SERP.

Como resultado, Google considera cada vez más cada resultado existente para continuar ofreciendo SERP relevantes con contenido seguro y de calidad. Estos sitios mal posicionados pueden haber experimentado una desaceleración en el momento de técnicas más abusivas aún no penalizadas por el motor.

Sr. Bert

El acrónimo de Representaciones de codificador bidireccional de Transformers se anuncia como la actualización más importante para el motor de búsqueda de Google durante 5 años, BERT se implementó oficialmente en Francia el 9 de diciembre de 2019 , en paralelo con el lanzamiento en muchos otros países.

BERT realmente representa los inicios de la inteligencia artificial, en última instancia, en el motor. Esto da como resultado la contextualización de las palabras clave resultantes de una consulta, que ya no son consideradas individualmente por el motor, sino como un todo.

BERT tiende a priorizar los términos y expresiones de una consulta por importancia para ganar en comprensión de lo que espera el usuario de Internet. Éste, que utiliza la búsqueda por voz más que nunca o en forma de pregunta escrita, verá los resultados ofrecidos en las SERP siempre más cerca de lo que esperaba inicialmente.

Google también utiliza BERT con más detalle para las siguientes tareas:

  • Comprender la cohesión textual y eliminar todas las ambigüedades de las expresiones u oraciones, especialmente cuando los matices polisémicos podrían modificar el significado de la investigación.
  • Comprender a qué entidades de pronombres se refieren es especialmente útil en párrafos largos con múltiples entidades. La búsqueda por voz es una aplicación concreta;
  • Predecir la siguiente oración
  • Responda preguntas directamente en las SERP
  • Resolver problemas de desambiguación

El algoritmo de BERT se basa en redes neuronales y Google lo lanzó como código abierto en noviembre de 2018. Así han surgido varias variantes más o menos mejoradas del algoritmo:

  • RoBERTa por Facebook
  • CamemBERT una versión francesa desarrollada por INRIA y derivada de RoBERTa
  • XLNet y ALBERT de Google y Toyota. Lanzado en septiembre de 2019, ALBERT ya se considera como el sucesor de BERT, que supera en todas las áreas (especialmente en términos de puntuación en SQuAD 2.0)
  • DistilBERT es una versión más pequeña, ligera y rápida de BERT

Impacto de BERT en SEO

Como Google había indicado para Rankbrain, no es posible optimizar para BERT. Es por eso que muchos SEO piensan que BERT es más un paso adelante para Google que para SEO.

Según Google, BERT tiene un impacto en el 10% de las búsquedas (esta cifra data del lanzamiento con consultas realizadas en inglés en EE. UU.). Probablemente sea menor para consultas de gran volumen que constan de pocas palabras.

El impacto en la clasificación de las palabras clave es probablemente mucho menor que el 10% de impacto, porque las consultas que está monitoreando probablemente no estén formuladas en lenguaje natural.

Ahora conoces un poco mejor todos los elementos que pueden influir en tu investigación o en el SEO de tu sitio web. Sin embargo, esta lista no es exhaustiva, porque también hay Big Daddy, Florida o Bourbon, actualizaciones de algoritmos incluso más antiguas.

3. Rankbrain, un desarrollo importante

Más

Google utiliza un sistema de inteligencia artificial de aprendizaje automático llamado "Rankbrain" para ayudarlo a clasificar los resultados de sus búsquedas. Su existencia se anunció públicamente en un artículo de Bloomberg el 26 de octubre de 2015, aunque se desconoce su fecha exacta de implementación. ¿Se pregunta cómo funciona y cómo encaja en el sistema de clasificación general de Google? Esto es lo que sabemos sobre Rankbrain.

La información que se presenta a continuación proviene de varias fuentes originales y se ha actualizado con el tiempo, con notas que indican dónde se han realizado las actualizaciones. Estas fuentes son:

Primero, el artículo de Bloomberg que puso a Rankbrain en primer plano. En segundo lugar, información adicional que Google ahora ha proporcionado directamente a Search Engine Land. En tercer lugar, nuestro propio conocimiento y nuestras mejores conjeturas en lugares donde Google no proporciona respuestas y también artículos de Twitter y LinkedIn de referencias de la industria e ingenieros de Google. Indicaremos claramente dónde se utilizan estas fuentes, cuando se considere necesario, además de la información general.

a. ¿Qué es RankBrain?

Rankbrain es el nombre de Google para un sistema de aprendizaje automático (o aprendizaje automático) que se utiliza para ayudar a procesar los resultados de búsqueda, como informó Bloomberg y como Google también nos confirmó.

segundo. ¿Qué es el aprendizaje automático?

El aprendizaje automático permite a los programas informáticos realizar tareas que solo los humanos son capaces de realizar con sus inteligencias o procesos mentales.

vs. ¿Qué es la inteligencia artificial?

Según Larousse: la inteligencia artificial es el conjunto de teorías y técnicas implementadas para crear máquinas capaces de simular inteligencia

Más simplemente, la inteligencia artificial, o IA para abreviar, permite que una computadora sea tan inteligente como un ser humano, al menos en el sentido de que adquiere conocimientos tanto al recibir la enseñanza como al confiar en ella. saberlo y hacer nuevas conexiones. Tal IA solo existe en las novelas de ciencia ficción, por supuesto. En la práctica, la IA se utiliza para referirse a los sistemas informáticos diseñados para aprender y hacer conexiones.

En otras palabras, el objetivo de la IA es permitir que las computadoras se vuelvan tan inteligentes como los humanos a través de enfoques matemáticos y estadísticos.

En otras palabras, podrán:

  • Para aprender a través de la experiencia;
  • Para organizar su memoria;
  • Razonar para resolver problemas por sí mismos.

En pocas palabras, todo parte de un modelo que utilizará la máquina para su entrenamiento. Por lo general, este modelo lo introduce un humano a partir de ciertos datos. La máquina utilizará el modelo y los datos para entrenar o resolver tareas prácticas que no están fuera del alcance de su modelo. Dependiendo de la retroalimentación sobre la calidad de sus respuestas o resultados, el programa reajusta los parámetros y luego el modelo.

En última instancia, el aprendizaje automático es donde una computadora o programa automático aprende a hacer algo por sí solo , en lugar de ser enseñado por humanos o seguir una programación detallada. A menudo sucede que los diseñadores no comprenden completamente cómo funcionan las cosas después. Esto es lo que sucedió según los ingenieros de Google, que ya no comprenden completamente cómo funciona Rankbrain.

Leer más sobre el tema

Relación entre Rankbrain y otros algoritmos

En cambio, lo lees Rankbrain es parte del "algoritmo" de búsqueda global de Google Hummingbird . Al igual que un automóvil tiene un motor general. El motor en sí puede constar de diferentes partes, como un filtro de aceite, bomba de combustible, radiador, etc. Asimismo, Hummingbird engloba distintas partes, siendo Rankbrain una de las más recientes.

Esta conclusión se toma del artículo de Bloomberg en el que Greg Corrado (el autor principal del artículo sobre la existencia de Rankbrain) dejó en claro que Rankbrain solo admitía el 15% de las consultas que hacía el sistema de Google. nunca tratado todavía.

 

Por tanto, es interesante preguntarse por qué Google lanzó su aprendizaje automático.

 

Hummingbird también contiene otras partes cuyos nombres son familiares para aquellos en el espacio de SEO como Panda, Penguin y Payday diseñados para combatir el spam, Pigeon diseñado para mejorar los resultados locales, Top Heavy diseñado para degradar las páginas a publicidad sólida, Mobile Friendly diseñado para recompensar las páginas optimizadas para dispositivos móviles y Pirate diseñado para luchar contra la infracción de derechos de autor.

Rankbrain es diferente de PageRank

PageRank es parte del algoritmo general que cubre una forma específica de dar crédito a las páginas basándose en los enlaces de otras páginas que apuntan a ellas.

PageRank es especial porque es el primer nombre que Google le dio a una de las partes de su algoritmo de clasificación, cuando se inició el motor de búsqueda, en 1998.

¿Qué pasa con esas "señales" que utiliza Google para la clasificación?

Las señales son cosas que utiliza Google para determinar cómo clasificar las páginas web. Por ejemplo, leerá las palabras en una página web, por lo que las palabras son una señal. Si algunas palabras están en negrita, esta puede ser otra señal que se anota (porque eso significaría que es importante). Los cálculos utilizados como parte de PageRank dan a una página una puntuación de PageRank que se utiliza como señal. Si una página está clasificada como compatible con dispositivos móviles, se registra otra señal.

Hoy en día, Rankbrain se considera la tercera señal más importante entre los más de 200 factores de clasificación de Google. Entonces, las tres señales más importantes son:

  • Les backlinks
  • El contenido
  • Rankbrain

Si desea una guía más visual para clasificar las señales, consulte nuestra tabla periódica de factores de éxito de SEO:

Tabla periódica de factores de éxito de optimización de motores de búsqueda 2015

 

Es una buena guía, en nuestra opinión, de las cosas generales que los motores de búsqueda como Google usan para ayudar a clasificar las páginas web.

Rankbrain es una de "cientos" de señales que entran en un algoritmo que determina qué resultados aparecen en una página de búsqueda de Google y dónde se clasifican, dijo Corrado. A los pocos meses de la implementación, RankBrain se convirtió en la tercera señal más importante que contribuye al resultado de una consulta de búsqueda, dijo.

 

¿Por qué RANKBRAIN?

Personalmente, creemos que los principales motivos de su lanzamiento son:

  • Las dificultades de interpretación de solicitudes nunca antes tratadas;
  • La naturaleza manual de codificar algoritmos existentes para realizar cambios

Las dificultades de interpretar solicitudes nunca antes tratadas

En sus inicios, el motor de búsqueda se basó principalmente en la presencia en las páginas web de palabras encontradas en una consulta para mostrar sus resultados.

Por ejemplo, si busca "abogados", el motor de búsqueda se encargará de proporcionar las páginas que contengan estas palabras.

Además, la más mínima variación en las expresiones utilizadas podría conducir a resultados diferentes.

Por ejemplo, el motor de búsqueda no puede dar los mismos resultados para "ropa" y "ropa". Lo mismo ocurre con las consultas de "mejores botas de jardín" y "mejores zapatos de jardín".

Pero el problema no acaba. Porque esta operación ha dado la oportunidad a algunos SEOs de “sombrero negro” de repetir palabras y expresiones en su contenido para encontrarse en la cima de los resultados. Y esto, incluso si su contenido es de mala calidad. Un ejemplo aquí .

Google ha evolucionado mucho desde entonces. El motor de búsqueda ahora logra detectar y castigar los sitios web que utilizan prácticas de SEO de Black Hat, en particular con los algoritmos Penguin y Panda.

Por el lado de la investigación, la firma naturalmente también ha logrado grandes avances. De hecho, el motor de búsqueda de hoy logra comprender cada vez más las consultas y asociarlas entre sí si significan lo mismo.

Las actualizaciones de Hummigbird, Stemming y Knowledge Graph han incorporado el cambio de Google para ver las palabras como "entidades" y no solo como una composición de caracteres.

Stemming te permite comprender las variaciones de la misma palabra del género: mango, mango, mango. Mientras tanto, el Gráfico de conocimiento fue una forma de que Google comprendiera mejor las relaciones en palabras del género al buscar "París", el usuario probablemente quiera buscar monumentos, actividades, personas relacionadas con la capital de Francia.

La naturaleza manual de la codificación de actualizaciones de algoritmos

Las estadísticas muestran que el motor tiene que lidiar constantemente con consultas que nadie ha buscado. Aproximadamente el 15% o casi 870 millones de búsquedas por día.

Para aplicar modificaciones al algoritmo con el fin de tener mejores resultados según las solicitudes, era necesario trabajar manualmente en él y dado el tamaño de estas búsquedas se comprende fácilmente que no es fácil. Bueno, entonces no del todo.

¿Qué hace exactamente RankBrain?

Con un ejemplo será más fácil. Imagine un pasante que realiza alrededor de 5,8 mil millones de tareas al día. En cada tarea, sus superiores dan consejos sobre el trabajo:

  • Perfecto: ¡esto es exactamente lo que quería!
  • Aún no es perfecto: todavía queda trabajo por hacer;
  • No, no resolviste la tarea: yo quería esto en su lugar.

El aprendiz recuerda bien todas las reacciones de sus superiores para hacerlo mejor mañana, donde solo el 15% serán tareas nuevas. Así funciona Rankbrain en esta analogía donde él es el interno y los usuarios son los superiores y las tareas de investigación.

 

RankBrain, por otro lado, aprende directamente de cómo interactuamos con sus resultados. Gary Illyes de Google lo describe de esta manera: “ [RankBrain] analiza los datos de búsquedas anteriores y, basándose en lo que ha funcionado bien para esa búsqueda, intentará predecir qué funcionará mejor para una determinada consulta. Funciona mejor para consultas de cola larga y consultas que nunca hemos visto. "

Por lo tanto, el sistema es completamente autónomo y no es necesario que le digan que tal o cual resultado es malo y que el problema debe resolverse de esa manera.

RankBrain ya tiene criterios, incluidas otras señales de clasificación, que le permiten saber si un resultado coincide perfectamente con una consulta o no. Tiene una gran base de datos de resultados de investigaciones antiguas que le permite tomar buenas decisiones. Entonces, si busca "zapatillas", es posible que comprenda que también se refiere a "zapatillas para correr". Incluso adquirió algunas nociones básicas, para entender que hay páginas sobre "Apple", la empresa tecnológica, y "Apple", la fruta.

Esta es la razón principal por la que RankBrain se desempeñó mejor que los ingenieros de Google. RankBrain predice qué funcionará mejor, lo prueba y, si el cambio funciona, lo mantiene en funcionamiento.

¿Es RankBrain realmente útil?

Si bien los ejemplos anteriores están lejos de ser convincentes para atestiguar la grandeza de Rankbrain, creo que probablemente tenga un gran impacto, como afirma Google. La compañía es bastante conservadora cuando se trata de su algoritmo de clasificación. Ella hace pequeñas pruebas todo el tiempo. Pero solo inicia grandes cambios cuando tiene un alto grado de confianza.

 

La integración de RankBrain, ya que se supone que es la tercera señal más importante, es un gran cambio.

¿RankBrain todavía está aprendiendo?

Todo lo que Rankbrain aprende está fuera de línea, nos dice Google. Hace mucha investigación histórica y aprende a hacer predicciones a partir de ella.

Estas predicciones se prueban y, si resultan ser correctas, se activa la última versión de RankBrain. Luego se repite el ciclo de aprendizaje y prueba fuera de línea.

¿RankBrain hace más que refinar las consultas?

Normalmente, la forma en que se refina una consulta no se considera un factor de clasificación o una señal.

Las señales suelen ser factores relacionados con el contenido, como las palabras en una página, enlaces que apuntan a una página, si una página está en un servidor seguro, etc. También se pueden vincular a un usuario, como dónde se encuentra un investigador o su historial de búsqueda y navegación.

Entonces, cuando Google habla de Rankbrain como la tercera señal más importante, ¿eso realmente significa una señal de clasificación? Si. Google nos ha confirmado que hay un elemento en el que Rankbrain contribuye directamente, de una forma u otra, al ranking de una página.

 

Rankbrain intenta comprender las consultas midiendo qué tan bien las SERP anteriores han cumplido con la intención del buscador. Luego, el aprendizaje automático usa esos datos para hacer predicciones sobre lo que las personas realmente buscan para la consulta.

Estas predicciones provienen de la vasta comprensión de RankBrain de cómo las palabras se relacionan entre sí. Lo que nos lleva al concepto de vectores de palabras.

VECTORES DE PALABRAS

Ya hemos visto que Google usa el Gráfico de conocimiento para relacionar palabras con conceptos que existen entre sí.

Fuente: Yashuseth

Pero solo funciona con la información que está presente en su base de datos.

Para ir más allá con el aprendizaje automático, Google recurrió a los vectores de palabras, ya que necesitaba aprender el significado de las palabras.

Para que esto sea efectivo, Google ha desarrollado una herramienta de código abierto llamada " Word2vec ":

Esta herramienta utiliza el aprendizaje automático y el procesamiento del lenguaje natural para comprender por sí solo el significado real de las palabras.

Ejemplo de vector de palabra

 

Google está mejorando continuamente su sistema y las consecuencias a menudo se notan en la clasificación de los resultados que ofrece. Esta es una de las razones por las que es poco probable que mantenga una posición determinada en las SERP.

Por ello, los especialistas en SEO se esfuerzan por conocer las tendencias relacionadas con los diversos factores que pueden afectar el posicionamiento de su sitio web.

Este es el caso de Rankbrain, que sigue disfrutando de un cierto misterio sobre cómo funciona y cómo se relaciona con otros factores de clasificación.