Qu’est-ce que RankBrain, et comment modifie-t-il la recherche Google ? Depuis 2015, Google s’appuie sur le système d’IA auto-apprenant RankBrain pour in­ter­pré­ter les requêtes de recherche. Il aide à iden­ti­fier les in­ten­tions des uti­li­sa­teurs, même pour des termes de recherche nouveaux ou complexes, et à fournir des résultats adaptés. L’al­go­rithme est basé sur le machine learning et est considéré comme faisant partie de la stratégie à long terme de Google en matière d’IA, dont DeepMind fait partie.

Outils d'IA
Exploitez toute la puissance de l'in­tel­li­gence ar­ti­fi­cielle
  • Créez votre site Web en un temps record
  • Boostez votre activité grâce au marketing par IA
  • Gagnez du temps et obtenez de meilleurs résultats

Qu’est-ce que RankBrain ? Dé­fi­ni­tion

RankBrain est un système d’IA auto-apprenant utilisé depuis début 2015 dans le cadre de l’al­go­rithme de recherche parent de Google, appelé « Hum­ming­bird ». La tâche prin­ci­pale de RankBrain consiste à in­ter­pré­ter les mots-clés et les ex­pres­sions de recherche dans le but de dé­ter­mi­ner l’intention de l’uti­li­sa­teur.

Google estime recevoir environ 8,5 milliards de requêtes par jour via la recherche Web. Environ 16 % de ces requêtes sont des mots-clés et des com­bi­nai­sons de mots-clés qui n’ont jamais été soumis à Google sous cette forme, y compris des termes familiers, des néo­lo­gismes ou des ex­pres­sions de longue traîne complexes.

Note

Lorsque Google désigne RankBrain comme un « système d’IA auto-apprenant », il désigne une in­tel­li­gence ar­ti­fi­cielle faible. Il s’agit d’une tech­no­lo­gie qui trouve des solutions au­to­ma­tiques à des problèmes qui devaient au­pa­ra­vant être traités par des humains. Comme la plupart des systèmes de ce type, RankBrain utilise des tech­niques de machine learning.

Comment fonc­tionne RankBrain ?

RankBrain aide Google à in­ter­pré­ter les données saisies par les uti­li­sa­teurs et à trouver dans l’index de recherche Google (une base de données d’environ 100 millions de gi­gaoc­tets) les sites Web qui cor­res­pon­dent le mieux à l’intention de recherche des uti­li­sa­teurs. Le système IA va bien au-delà de la simple com­pa­rai­son des termes de recherche.

Au lieu d’analyser in­dé­pen­dam­ment chaque mot d’une requête de recherche, RankBrain saisit la sé­man­tique de l’ensemble de la saisie de l’uti­li­sa­teur et détermine ainsi l’intention de l’uti­li­sa­teur qui effectue la recherche. Même s’il s’agit d’une ex­pres­sion à longue traîne, on obtient la réponse espérée en un clin d’œil.

Image: Page de résultats de recherche Google pour la recherche « What’s the title of the consumer at the highest level of a food chain »
Au sommet de la chaîne ali­men­taire se trouve le prédateur « Apex ».

RankBrain, en tant que système de machine learning, s’appuie sur son ex­pé­rience des re­cherches pré­cé­dentes. Il établit des liens et prédit sur cette base ce que l’uti­li­sa­teur recherche et la meilleure façon de répondre à sa requête. Il peut résoudre les am­bi­guï­tés et décrypter la sig­ni­fi­ca­tion de termes inconnus (comme les néo­lo­gismes).

Google ne précise toutefois pas comment RankBrain relève ce défi. Les experts en ré­fé­ren­ce­ment suggèrent qu’il utilise des vecteurs de mots pour traduire les requêtes de recherche en une forme qui permet aux or­di­na­teurs d’in­ter­pré­ter les relations de sens.

Quelle est la base des analyses sé­man­tiques de RankBrain ?

Selon plusieurs dé­cla­ra­tions d’in­gé­nieurs de Google, RankBrain se base en partie sur des concepts tels que Word2Vec et utilise des tech­niques si­mi­laires d’espace vectoriel pour saisir le sens des mots. En effet, dès 2013, Google a publié le logiciel de machine learning à code source libre Word2Vec, qui permet de traduire les relations sé­man­tiques entre les mots en une re­pré­sen­ta­tion ma­thé­ma­tique, de les mesurer et de les comparer. Cette analyse se base sur des corpus de textes lin­guis­tiques.

Création de l’espace vectoriel

Pour « apprendre » les relations de sens entre les mots, la première étape de Word2Vec consiste à créer un espace vectoriel à n di­men­sions, dans lequel chaque mot du corpus de texte sous-jacent (on parle de « données d’en­traî­ne­ment ») est re­pré­senté sous forme de vecteur. n indique le nombre de di­men­sions vec­to­rielles dans les­quelles un mot doit être re­pré­senté. Plus le nombre de di­men­sions choisies pour les vecteurs de mots est élevé, plus le programme saisit de relations avec d’autres mots.

Ajus­te­ment de l’espace vectoriel

Dans la deuxième étape, l’espace vectoriel créé est injecté dans un réseau neuronal ar­ti­fi­ciel (RNA) qui permet de l’adapter à l’aide d’un al­go­rithme d’ap­pren­tis­sage, afin que les mots utilisés dans le même contexte forment également un vecteur de mots similaire. La si­mi­la­rité entre les vecteurs de mots est calculée en utilisant la distance cosinus comme valeur comprise entre -1 et +1.

Le rôle de Word2Vec

Si vous donnez à Word2Vec un corpus de texte quel­conque en entrée, le programme fournit en sortie les vecteurs de mots cor­res­pon­dants. Ceux-ci per­met­tent d’évaluer la proximité ou la distance sé­man­tique des mots contenus dans le corpus. Si Word2Vec est confronté à une nouvelle entrée, le programme est capable, grâce à l’al­go­rithme d’ap­pren­tis­sage, d’adapter l’espace vectoriel et d’établir ainsi de nouvelles relations de sens ou de rejeter d’anciennes hy­po­thèses : le réseau neuronal est « entraîné ».

Of­fi­ciel­le­ment, Google n’établit pas de lien entre le fonc­tion­ne­ment de Word2Vec et le composant de l’al­go­rithme de recherche RankBrain, mais on peut supposer que le système d’IA s’appuie sur des opé­ra­tions ma­thé­ma­tiques si­mi­laires.

Conseil

À l’aide de réseaux neuronaux ar­ti­fi­ciels, les cher­cheurs tentent de simuler les principes d’or­ga­ni­sa­tion et de trai­te­ment du cerveau humain. L’objectif est de dé­ve­lop­per des systèmes capables de gérer le vague ou l’im­pré­ci­sion dans la ré­so­lu­tion de problèmes, et donc d’effectuer des tâches jusqu’ici réservées aux humains. Les réseaux neuronaux sont utilisés par Google dans le cadre de la re­con­nais­sance au­to­ma­tique des images, par exemple.

RankBrain comme facteur de clas­se­ment SEO

Encore plus sur­pre­nant que l’annonce de l’in­té­gra­tion des re­cherches de Google en in­tel­li­gence ar­ti­fi­cielle dans la recherche Web, c’est l’ampleur de cette in­té­gra­tion : depuis 2016, toutes les requêtes sont in­ter­pré­tées par RankBrain.

Note

Selon Andrey Lipattsev, Search Quality Senior Stra­te­gist chez Google, RankBrain était pré­cé­dem­ment le troisième facteur de clas­se­ment le plus important. Mais depuis, l’al­go­rithme de Google a évolué et est aujourd’hui complété par BERT et d’autres tech­no­lo­gies d’IA.

Pour les pro­prié­taires de sites Web et les experts en ré­fé­ren­ce­ment, c’est surtout le regard porté sur les stra­té­gies de mots-clés qui a changé. En tant que moteur de recherche sé­man­tique, Google est capable de s’appuyer sur des con­nais­sances de base sous forme de concepts et de relations pour dé­ter­mi­ner la sig­ni­fi­ca­tion du contenu des textes et des requêtes de recherche. Ainsi, le clas­se­ment d’un site Web pour un mot-clé donné dépend moins de la présence de ce mot-clé que de la per­ti­nence du contenu (textuel) du site Web par rapport au concept que RankBrain associe au mot-clé. L’accent n’est donc pas mis sur le mot-clé en lui-même, mais sur la per­ti­nence du contenu du site.

New call-to-action

Grâce à RankBrain et au dé­ve­lop­pe­ment continu de BERT et d’autres tech­no­lo­gies, la per­ti­nence du contenu et l’intention de l’uti­li­sa­teur sont encore plus au cœur de l’op­ti­mi­sa­tion des moteurs de recherche.

Les modules d’IA qui com­plè­tent RankBrain

RankBrain a été lancé en 2015 et était alors considéré comme une percée dans l’in­ter­pré­ta­tion des requêtes de recherche par Google, mais la tech­no­lo­gie a évolué depuis. Aujourd’hui, RankBrain reste un élément important de l’al­go­rithme de Google, notamment pour l’in­ter­pré­ta­tion des termes de recherche et la dé­ter­mi­na­tion de l’intention de l’uti­li­sa­teur. Cependant, il n’est plus le seul facteur dé­ter­mi­nant l’in­ter­pré­ta­tion des requêtes de recherche.

BERT en soutien à RankBrain

En 2019, Google a introduit BERT (Bi­di­rec­tio­nal Encoder Re­pre­sen­ta­tions from Trans­for­mers), un autre modèle d’IA qui complète RankBrain dans le trai­te­ment des entrées en langage naturel. Alors que RankBrain aide notamment à l’analyse sé­man­tique des termes de recherche longue traîne et des com­bi­nai­sons de mots inconnues, BERT in­ter­vient davantage dans la con­tex­tua­li­sa­tion de phrases complètes et la prise en compte du sens des mots dans leur contexte spé­ci­fique.

MUM et autres tech­no­lo­gies d’IA pour l’in­ter­pré­ta­tion des requêtes de recherche

Outre RankBrain, Google s’appuie désormais sur d’autres modèles d’IA tels que BERT et MUM (Multitask Unified Model) pour mieux com­prendre les requêtes de recherche. Ce sont surtout les questions complexes ou ambiguës qui bé­né­fi­cient de ces dé­ve­lop­pe­ments. MUM est capable de combiner des in­for­ma­tions provenant de dif­fé­rentes sources et de dif­fé­rents formats (comme le texte et les images) et de les mettre en relation de manière per­ti­nente.

Même si Google n’a jamais com­plè­te­ment révélé comment RankBrain, BERT et MUM in­te­ra­gis­sent, il est clair que la tech­no­lo­gie de recherche sé­man­tique a con­si­dé­ra­ble­ment évolué.

Modules IA im­por­tants dans l’al­go­rithme de Google :

  • RankBrain in­ter­prète les requêtes de recherche, en par­ti­cu­lier les for­mu­la­tions nouvelles ou in­ha­bi­tuelles.
  • BERT analyse le contexte des mots dans les requêtes de recherche (par exemple la structure de la phrase).
  • MUM comprend les in­ten­tions de recherche complexes et combine le contenu de dif­fé­rents formats.

Cela signifie donc que le SEO classique, avec des mots-clés et de la technique seule, ne suffit plus. Ce qui est décisif aujourd’hui, c’est un contenu de haute qualité, centré sur l’uti­li­sa­teur, qui tient compte de l’intention de recherche, du contexte et de la per­ti­nence sé­man­tique.

Aller au menu principal