Le cloaking en SEO : une technique de référencement abusive punie par Google

Le cloaking (soit « dissimulation » en anglais) est une technique de référencement naturel abusive. On évoque ce terme dès lors qu’un serveur est programmé de manière à présenter le contenu d’une page d’un site Internet différemment. Ce contenu affichera deux versions : une pour les robots d’indexation (bots) des moteurs de recherche, et une version pour les internautes. C’est une méthode « black hat » (« chapeau noir » en français), contraire à l’éthique et interdite par les moteurs de recherche, visant à obtenir un meilleur référencement. Pourtant, toutes les méthodes de cloaking ne sont pas mal intentionnées.

Aux sources du cloaking

Les sites Web dont les éléments principaux sont constitués de graphiques, de vidéos ou d’animations flash sont les plus difficiles à maintenir. Le contenu multimédia est généralement apprécié des utilisateurs, mais il ne peut être lu que dans les grandes lignes par les moteurs de recherche. Ce déficit peut être compensé par le cloaking, afin que le robot d’indexation puisse lire facilement la description des contenus sous forme de texte. Mais le rendu sélectif d’une même page peut représenter un potentiel référencement abusif.

Le cloaking en tant que technique de référencement abusif

De nombreux administrateurs de sites Web utilisent des méthodes de cloaking pour présenter des contenus aux robots d’indexation et qui ne sont pas visibles pour les visiteurs de ce même site. Cette tentative de manipulation peut être comparée au site Web fictif d’un casino :

Pour augmenter sa visibilité sur le Web, le prestataire d’un casino en ligne fournit aux robots d’indexation des contenus ciblés concernant des jeux de société. Et ce, alors que les visiteurs d’un site Web ne peuvent avoir accès qu’à des jeux de hasard payants. Le moteur de recherche référence alors le site Web dans l’index des jeux de sociétés à cause de ces fausses informations, et affiche le site parmi les résultats de recherche sur les jeux de sociétés en fonction de ces mots-clés utilisés de manière abusive. C’est au désavantage des internautes qui n’obtiennent pas les résultats de recherche désirés sur les jeux de sociétés, et aux dépens du moteur de recherche qui ne propose pas un contenu pertinent en affichant un casino en ligne parmi les résultats.

Pour éviter ce type de manipulations, les moteurs de recherche prennent des mesures sévères contre ces méthodes qui nuisent à la pertinence des résultats. Google, le leader du marché, compte même une équipe de spécialistes dédiée à la lutte contre le cloaking abusif, appellé le Webspam Team. Par conséquent, les sites Web qui ont recours à ces méthodes doivent s’attendre à ce que leur site Web puisse disparaitre des résultats de recherche en guise de sanction.

Les différentes techniques de cloaking

Les administrateurs de sites Web qui ont recours aux méthodes de référencement Black Hat ont recours à deux moyens différents pour duper les moteurs de recherche :

Agent Name Delivery

L’accès au site Web s’effectue généralement via un user-agent. En guise d’exemple, on compte les applications client ainsi que les navigateurs Web, et les programmes automatisés comme les robots d’indexation. Ceux-ci possèdent un identifiant qui leur est propre, nommé le agent name (nom d’agent). Cela permet au serveur de moduler les contenus en question à l’aide de feuilles de style optimisées afin d’améliorer l’ergonomie d’un site Web. Ainsi, l’agent name delivery constitue la base d’une optimisation de la présentation sur tous les supports. Mais ce procédé est considéré comme relevant du cloaking que lorsque les administrateurs de sites intègrent d’autres mécanismes qui réagissent aux Google bots en livrant des contenus différents.

IP Delivery

À côté de l’agent name, l’adresse IP est une autre possibilité pour segmenter les visiteurs de sites Web et leur fournir un contenu différent. Ce procédé est utilisé dans le cadre du Geotargeting, afin que la langue soit automatiquement adaptée aux visiteurs du site Web, ou encore l’offre en fonction des régions. Mais la technique de l’IP delivery n’est abusive que lorsque les administrateurs livrent des contenus dédiés uniquement à l’adresse IP standard du robot d’indexation. Une telle méthode de référencement Black Hat ne fonctionne que si le bot en question utilise toujours la même adresse IP. Pour éviter ces manipulations, la majorité des moteurs de recherche misent sur des adresses IP changeantes.

Dans une vidéo officielle dédiée au sujet, Matt Cutts (l’ancien chef de l’équipe Webspam de Google), a insisté sur le fait que le geotargeting et l’adaptation du contenu d’un site à différentes tailles d’écran ne constitue en aucun cas du cloaking, mais que cela relève de mesures appréciables pour plus d’ergonomie et de convivialité.

Pour afficher cette vidéo, des cookies de tiers sont nécessaires. Vous pouvez consulter et modifier vos paramètres de cookies ici.

Astuces pour les administrateurs de sites Web

Google donne deux lignes de conduite aux administrateurs de sites Web qui souhaitent éviter les sanctions induites par le cloaking :

  • Les contenus des sites Web devraient être présentés de manière identique aux robots d’indexation et aux internautes.
  • Les lignes de code suspectes et qui devraient être évitées sont celles qui cherchent l’adresse IP d’un navigateur Web ou un agent name en particulier.

Il est également préférable d’éviter les contenus difficiles à lire pour les robots d’indexation, c’est pourquoi il est conseillé de privilégier les descriptions pour certains contenus (images, vidéos et animations flash) dans les meta-tags. Pour cela, il est possible de voir comment le Google Bot perçoit votre site Web à l’aide de la Google Search Console.