Le cloaking (soit « dis­si­mu­la­tion » en anglais) est une technique de ré­fé­ren­ce­ment naturel abusive. On évoque ce terme dès lors qu’un serveur est programmé de manière à présenter le contenu d’une page d’un site Internet dif­fé­rem­ment. Ce contenu affichera deux versions : une pour les robots d’in­dexa­tion (bots) des moteurs de recherche, et une version pour les in­ter­nautes. C’est une méthode « black hat » (« chapeau noir » en français), contraire à l’éthique et interdite par les moteurs de recherche, visant à obtenir un meilleur ré­fé­ren­ce­ment. Pourtant, toutes les méthodes de cloaking ne sont pas mal in­ten­tion­nées.

Aux sources du cloaking

Les sites Web dont les éléments prin­ci­paux sont cons­ti­tués de gra­phiques, de vidéos ou d’ani­ma­tions flash sont les plus dif­fi­ciles à maintenir. Le contenu mul­ti­mé­dia est gé­né­ra­le­ment apprécié des uti­li­sa­teurs, mais il ne peut être lu que dans les grandes lignes par les moteurs de recherche. Ce déficit peut être compensé par le cloaking, afin que le robot d’in­dexa­tion puisse lire fa­ci­le­ment la des­crip­tion des contenus sous forme de texte. Mais le rendu sélectif d’une même page peut re­pré­sen­ter un potentiel ré­fé­ren­ce­ment abusif.

Le cloaking en tant que technique de ré­fé­ren­ce­ment abusif

De nombreux ad­mi­nis­tra­teurs de sites Web utilisent des méthodes de cloaking pour présenter des contenus aux robots d’in­dexa­tion et qui ne sont pas visibles pour les visiteurs de ce même site. Cette tentative de ma­ni­pu­la­tion peut être comparée au site Web fictif d’un casino :

Pour augmenter sa vi­si­bi­lité sur le Web, le pres­ta­taire d’un casino en ligne fournit aux robots d’in­dexa­tion des contenus ciblés con­cer­nant des jeux de société. Et ce, alors que les visiteurs d’un site Web ne peuvent avoir accès qu’à des jeux de hasard payants. Le moteur de recherche référence alors le site Web dans l’index des jeux de sociétés à cause de ces fausses in­for­ma­tions, et affiche le site parmi les résultats de recherche sur les jeux de sociétés en fonction de ces mots-clés utilisés de manière abusive. C’est au dé­sa­van­tage des in­ter­nautes qui n’ob­tien­nent pas les résultats de recherche désirés sur les jeux de sociétés, et aux dépens du moteur de recherche qui ne propose pas un contenu pertinent en affichant un casino en ligne parmi les résultats.

Pour éviter ce type de ma­ni­pu­la­tions, les moteurs de recherche prennent des mesures sévères contre ces méthodes qui nuisent à la per­ti­nence des résultats. Google, le leader du marché, compte même une équipe de spé­cia­listes dédiée à la lutte contre le cloaking abusif, appellé le Webspam Team. Par con­sé­quent, les sites Web qui ont recours à ces méthodes doivent s’attendre à ce que leur site Web puisse dis­pa­raitre des résultats de recherche en guise de sanction.

Les dif­fé­rentes tech­niques de cloaking

Les ad­mi­nis­tra­teurs de sites Web qui ont recours aux méthodes de ré­fé­ren­ce­ment Black Hat ont recours à deux moyens dif­fé­rents pour duper les moteurs de recherche :

Agent Name Delivery

L’accès au site Web s’effectue gé­né­ra­le­ment via un user-agent. En guise d’exemple, on compte les ap­pli­ca­tions client ainsi que les na­vi­ga­teurs Web, et les pro­grammes au­to­ma­ti­sés comme les robots d’in­dexa­tion. Ceux-ci possèdent un iden­ti­fiant qui leur est propre, nommé le agent name (nom d’agent). Cela permet au serveur de moduler les contenus en question à l’aide de feuilles de style op­ti­mi­sées afin d’améliorer l’ergonomie d’un site Web. Ainsi, l’agent name delivery constitue la base d’une op­ti­mi­sa­tion de la pré­sen­ta­tion sur tous les supports. Mais ce procédé est considéré comme relevant du cloaking que lorsque les ad­mi­nis­tra­teurs de sites intègrent d’autres mé­ca­nismes qui réa­gis­sent aux Google bots en livrant des contenus dif­fé­rents.

IP Delivery

À côté de l’agent name, l’adresse IP est une autre pos­si­bi­lité pour segmenter les visiteurs de sites Web et leur fournir un contenu différent. Ce procédé est utilisé dans le cadre du Geo­tar­ge­ting, afin que la langue soit au­to­ma­ti­que­ment adaptée aux visiteurs du site Web, ou encore l’offre en fonction des régions. Mais la technique de l’IP delivery n’est abusive que lorsque les ad­mi­nis­tra­teurs livrent des contenus dédiés uni­que­ment à l’adresse IP standard du robot d’in­dexa­tion. Une telle méthode de ré­fé­ren­ce­ment Black Hat ne fonc­tionne que si le bot en question utilise toujours la même adresse IP. Pour éviter ces ma­ni­pu­la­tions, la majorité des moteurs de recherche misent sur des adresses IP chan­geantes.

Dans une vidéo of­fi­cielle dédiée au sujet, Matt Cutts (l’ancien chef de l’équipe Webspam de Google), a insisté sur le fait que le geo­tar­ge­ting et l’adap­ta­tion du contenu d’un site à dif­fé­rentes tailles d’écran ne constitue en aucun cas du cloaking, mais que cela relève de mesures ap­pré­ciables pour plus d’ergonomie et de con­vi­via­lité.

Astuces pour les ad­mi­nis­tra­teurs de sites Web

Google donne deux lignes de conduite aux ad­mi­nis­tra­teurs de sites Web qui sou­hai­tent éviter les sanctions induites par le cloaking :

  • Les contenus des sites Web devraient être présentés de manière identique aux robots d’in­dexa­tion et aux in­ter­nautes.
  • Les lignes de code suspectes et qui devraient être évitées sont celles qui cherchent l’adresse IP d’un na­vi­ga­teur Web ou un agent name en par­ti­cu­lier.

Il est également pré­fé­rable d’éviter les contenus dif­fi­ciles à lire pour les robots d’in­dexa­tion, c’est pourquoi il est conseillé de pri­vi­lé­gier les des­crip­tions pour certains contenus (images, vidéos et ani­ma­tions flash) dans les meta-tags. Pour cela, il est possible de voir comment le Google Bot perçoit votre site Web à l’aide de la Google Search Console.

Aller au menu principal