RankBrain : l’évolution de l’algorithme de Google
Qu’est-ce que RankBrain, et comment modifie-t-il la recherche Google ? Depuis 2015, Google s’appuie sur le système d’IA auto-apprenant RankBrain pour interpréter les requêtes de recherche. Il aide à identifier les intentions des utilisateurs, même pour des termes de recherche nouveaux ou complexes, et à fournir des résultats adaptés. L’algorithme est basé sur le machine learning et est considéré comme faisant partie de la stratégie à long terme de Google en matière d’IA, dont DeepMind fait partie.
- Créez votre site Web en un temps record
- Boostez votre activité grâce au marketing par IA
- Gagnez du temps et obtenez de meilleurs résultats
Qu’est-ce que RankBrain ? Définition
RankBrain est un système d’IA auto-apprenant utilisé depuis début 2015 dans le cadre de l’algorithme de recherche parent de Google, appelé « Hummingbird ». La tâche principale de RankBrain consiste à interpréter les mots-clés et les expressions de recherche dans le but de déterminer l’intention de l’utilisateur.
Google estime recevoir environ 8,5 milliards de requêtes par jour via la recherche Web. Environ 16 % de ces requêtes sont des mots-clés et des combinaisons de mots-clés qui n’ont jamais été soumis à Google sous cette forme, y compris des termes familiers, des néologismes ou des expressions de longue traîne complexes.
Lorsque Google désigne RankBrain comme un « système d’IA auto-apprenant », il désigne une intelligence artificielle faible. Il s’agit d’une technologie qui trouve des solutions automatiques à des problèmes qui devaient auparavant être traités par des humains. Comme la plupart des systèmes de ce type, RankBrain utilise des techniques de machine learning.
Comment fonctionne RankBrain ?
RankBrain aide Google à interpréter les données saisies par les utilisateurs et à trouver dans l’index de recherche Google (une base de données d’environ 100 millions de gigaoctets) les sites Web qui correspondent le mieux à l’intention de recherche des utilisateurs. Le système IA va bien au-delà de la simple comparaison des termes de recherche.
Au lieu d’analyser indépendamment chaque mot d’une requête de recherche, RankBrain saisit la sémantique de l’ensemble de la saisie de l’utilisateur et détermine ainsi l’intention de l’utilisateur qui effectue la recherche. Même s’il s’agit d’une expression à longue traîne, on obtient la réponse espérée en un clin d’œil.

RankBrain, en tant que système de machine learning, s’appuie sur son expérience des recherches précédentes. Il établit des liens et prédit sur cette base ce que l’utilisateur recherche et la meilleure façon de répondre à sa requête. Il peut résoudre les ambiguïtés et décrypter la signification de termes inconnus (comme les néologismes).
Google ne précise toutefois pas comment RankBrain relève ce défi. Les experts en référencement suggèrent qu’il utilise des vecteurs de mots pour traduire les requêtes de recherche en une forme qui permet aux ordinateurs d’interpréter les relations de sens.
Quelle est la base des analyses sémantiques de RankBrain ?
Selon plusieurs déclarations d’ingénieurs de Google, RankBrain se base en partie sur des concepts tels que Word2Vec et utilise des techniques similaires d’espace vectoriel pour saisir le sens des mots. En effet, dès 2013, Google a publié le logiciel de machine learning à code source libre Word2Vec, qui permet de traduire les relations sémantiques entre les mots en une représentation mathématique, de les mesurer et de les comparer. Cette analyse se base sur des corpus de textes linguistiques.
Création de l’espace vectoriel
Pour « apprendre » les relations de sens entre les mots, la première étape de Word2Vec consiste à créer un espace vectoriel à n dimensions, dans lequel chaque mot du corpus de texte sous-jacent (on parle de « données d’entraînement ») est représenté sous forme de vecteur. n indique le nombre de dimensions vectorielles dans lesquelles un mot doit être représenté. Plus le nombre de dimensions choisies pour les vecteurs de mots est élevé, plus le programme saisit de relations avec d’autres mots.
Ajustement de l’espace vectoriel
Dans la deuxième étape, l’espace vectoriel créé est injecté dans un réseau neuronal artificiel (RNA) qui permet de l’adapter à l’aide d’un algorithme d’apprentissage, afin que les mots utilisés dans le même contexte forment également un vecteur de mots similaire. La similarité entre les vecteurs de mots est calculée en utilisant la distance cosinus comme valeur comprise entre -1 et +1.
Le rôle de Word2Vec
Si vous donnez à Word2Vec un corpus de texte quelconque en entrée, le programme fournit en sortie les vecteurs de mots correspondants. Ceux-ci permettent d’évaluer la proximité ou la distance sémantique des mots contenus dans le corpus. Si Word2Vec est confronté à une nouvelle entrée, le programme est capable, grâce à l’algorithme d’apprentissage, d’adapter l’espace vectoriel et d’établir ainsi de nouvelles relations de sens ou de rejeter d’anciennes hypothèses : le réseau neuronal est « entraîné ».
Officiellement, Google n’établit pas de lien entre le fonctionnement de Word2Vec et le composant de l’algorithme de recherche RankBrain, mais on peut supposer que le système d’IA s’appuie sur des opérations mathématiques similaires.
À l’aide de réseaux neuronaux artificiels, les chercheurs tentent de simuler les principes d’organisation et de traitement du cerveau humain. L’objectif est de développer des systèmes capables de gérer le vague ou l’imprécision dans la résolution de problèmes, et donc d’effectuer des tâches jusqu’ici réservées aux humains. Les réseaux neuronaux sont utilisés par Google dans le cadre de la reconnaissance automatique des images, par exemple.
RankBrain comme facteur de classement SEO
Encore plus surprenant que l’annonce de l’intégration des recherches de Google en intelligence artificielle dans la recherche Web, c’est l’ampleur de cette intégration : depuis 2016, toutes les requêtes sont interprétées par RankBrain.
Selon Andrey Lipattsev, Search Quality Senior Strategist chez Google, RankBrain était précédemment le troisième facteur de classement le plus important. Mais depuis, l’algorithme de Google a évolué et est aujourd’hui complété par BERT et d’autres technologies d’IA.
Pour les propriétaires de sites Web et les experts en référencement, c’est surtout le regard porté sur les stratégies de mots-clés qui a changé. En tant que moteur de recherche sémantique, Google est capable de s’appuyer sur des connaissances de base sous forme de concepts et de relations pour déterminer la signification du contenu des textes et des requêtes de recherche. Ainsi, le classement d’un site Web pour un mot-clé donné dépend moins de la présence de ce mot-clé que de la pertinence du contenu (textuel) du site Web par rapport au concept que RankBrain associe au mot-clé. L’accent n’est donc pas mis sur le mot-clé en lui-même, mais sur la pertinence du contenu du site.
Grâce à RankBrain et au développement continu de BERT et d’autres technologies, la pertinence du contenu et l’intention de l’utilisateur sont encore plus au cœur de l’optimisation des moteurs de recherche.
Les modules d’IA qui complètent RankBrain
RankBrain a été lancé en 2015 et était alors considéré comme une percée dans l’interprétation des requêtes de recherche par Google, mais la technologie a évolué depuis. Aujourd’hui, RankBrain reste un élément important de l’algorithme de Google, notamment pour l’interprétation des termes de recherche et la détermination de l’intention de l’utilisateur. Cependant, il n’est plus le seul facteur déterminant l’interprétation des requêtes de recherche.
BERT en soutien à RankBrain
En 2019, Google a introduit BERT (Bidirectional Encoder Representations from Transformers), un autre modèle d’IA qui complète RankBrain dans le traitement des entrées en langage naturel. Alors que RankBrain aide notamment à l’analyse sémantique des termes de recherche longue traîne et des combinaisons de mots inconnues, BERT intervient davantage dans la contextualisation de phrases complètes et la prise en compte du sens des mots dans leur contexte spécifique.
MUM et autres technologies d’IA pour l’interprétation des requêtes de recherche
Outre RankBrain, Google s’appuie désormais sur d’autres modèles d’IA tels que BERT et MUM (Multitask Unified Model) pour mieux comprendre les requêtes de recherche. Ce sont surtout les questions complexes ou ambiguës qui bénéficient de ces développements. MUM est capable de combiner des informations provenant de différentes sources et de différents formats (comme le texte et les images) et de les mettre en relation de manière pertinente.
Même si Google n’a jamais complètement révélé comment RankBrain, BERT et MUM interagissent, il est clair que la technologie de recherche sémantique a considérablement évolué.
Modules IA importants dans l’algorithme de Google :
- RankBrain interprète les requêtes de recherche, en particulier les formulations nouvelles ou inhabituelles.
- BERT analyse le contexte des mots dans les requêtes de recherche (par exemple la structure de la phrase).
- MUM comprend les intentions de recherche complexes et combine le contenu de différents formats.
Cela signifie donc que le SEO classique, avec des mots-clés et de la technique seule, ne suffit plus. Ce qui est décisif aujourd’hui, c’est un contenu de haute qualité, centré sur l’utilisateur, qui tient compte de l’intention de recherche, du contexte et de la pertinence sémantique.


