Lorsque le contenu d’une page peut être consulté sous plusieurs URLs dif­fé­rentes, il est considéré comme contenu dupliqué (en anglais : duplicate content), ce qui peut avoir pour con­sé­quence que la page en question ne soit pas indexée par le moteur de recherche. Cela pose par exemple un défi aux projets Web qui proposent des contenus quasiment iden­tiques dans la même langue sous des domaines spé­ci­fiques à dif­fé­rents pays.

Une solution possible à ce problème est le Canonical tag (balise canonique), qui vous permet de déclarer une URL ou une URI comme ressource standard pour l’in­dexa­tion.

Une balise canonique, c’est quoi ?

En 2009, Yahoo, Microsoft et Google pré­sen­tent le « Canonical tag » pour les liens, une balise qui allait ra­pi­de­ment devenir l’un des prin­ci­paux outils pour le SEO et qui est dis­tin­guée depuis 2012 comme standard officiel du Web dans le RFC 6596. Si le lien canonique est intégré à une page, il renvoie à une URL ou une URI standard indiquée, également appelée URL canonique, qui doit être utilisée comme source d’in­dexa­tion à la place de cette page.

L’URL canonique combine donc sa propre po­pu­la­rité de lien et sa ré­pu­ta­tion avec celles des pages de référence : elle génère ainsi un meilleur clas­se­ment. Comme les URL marquées par la balise ne sont pas incluses dans l’index, il n’y a pas de problème de contenu dupliqué. Toutefois, l’at­tri­bu­tion n’est qu’une sug­ges­tion aux moteurs de recherche, qui ne doivent donc pas né­ces­sai­re­ment saisir l’attribut de lien et l’inclure dans leur éva­lua­tion. Si l’im­plé­men­ta­tion est in­com­plète ou erronée, il existe même le risque que l’ensemble du site soit ignoré, d’où l’im­por­tance d’utiliser cor­rec­te­ment la balise canonique.

ran­king­Coach
Boostez vos ventes grâce au marketing digital par IA
  • Améliorez votre clas­se­ment sur Google sans les frais d'une agence
  • Répondez aux avis clients et générez des pu­bli­ca­tions pour les réseaux
  • Aucune con­nais­sance en ré­fé­ren­ce­ment et marketing en ligne requise

Canonical Tag : comment ça marche ?

Pour que la balise canonique fonc­tionne, deux choses sont né­ces­saires : d’une part, vous avez besoin de l’URL exact de la page canonique souhaitée, qui doit être déclarée comme ressource standard. D’autre part, vous avez besoin d’un élément de lien dans lequel vous pouvez insérer l’URL canonique, y compris l’élément Canonical. Le code se présente ainsi :

<link rel="canonical" href="URL/URI de la page canonique">
html

L’élément lien, qui n’a pas de balise de fin en HTML, contient comme élément vide uni­que­ment les attributs rel et href. Le premier est né­ces­saire pour spécifier la relation entre le document actuel et le document lié, tandis que le second indique où se trouve le document lié. Les valeurs né­ces­saires à cet effet se trouvent à l’intérieur des guil­le­mets : la valeur rel "canonical" indique que l’URL liée doit être une URL canonique, qui est ensuite indiquée dans l’attribut href.

Pour que les pages al­ter­na­tives se réfèrent à la ressource standard indiquée, le code doit être inséré dans la zone Head des documents HTML cor­res­pon­dants. Si le contenu n’est pas en HTML, par exemple dans le cas d’un fichier PDF, il est également possible de l’im­plé­men­ter dans le HTTP-Header Cela implique une syntaxe lé­gè­re­ment dif­fé­rente :

Link: <URL/URI de la page canonique>; rel="canonical"
html

Quand utiliser le Canonical tag ?

Par dé­fi­ni­tion, le Canonical tag n’est pas un facteur que les moteurs de recherche doivent ab­so­lu­ment prendre en compte. Comme le code doit en outre être im­plé­menté sé­pa­ré­ment pour chaque contenu présent plusieurs fois et chaque URI al­ter­na­tive, la question se pose de savoir si l’effort re­la­ti­ve­ment important est ef­fec­ti­ve­ment rentable au final. Découvrez ci-dessous quatre scénarios dans lesquels vous devriez ab­so­lu­ment envisager l’uti­li­sa­tion de la balise canonique.

Les contenus sont dis­tri­bués sur des URLs dy­na­miques

Les URLs dy­na­miques jouent un rôle important de nos jours, surtout dans l’e-commerce. Les pages spé­ci­fiques à l’uti­li­sa­teur re­pré­sen­tent certes une option ex­cel­lente et simple pour présenter le même contenu (y compris de légères va­ria­tions) à dif­fé­rents uti­li­sa­teurs, mais elles posent ré­gu­liè­re­ment des problèmes au crawler du moteur de recherche. Dans ce cas, les balises Canonical sont re­com­man­dées pour éviter d’éven­tuelles clas­si­fi­ca­tions en tant que contenu dupliqué.

Les contenus sont ac­ces­sibles via dif­fé­rentes URLs

Pour des raisons struc­tu­relles, certains projets Web tels que les blogs, les boutiques en ligne ou les portails de conseils proposent des contenus dans plusieurs ca­té­go­ries à la fois et donc souvent sous dif­fé­rentes URLs. Ainsi, une boutique pourrait par exemple proposer si­mul­ta­né­ment la page d’aperçu de l’article « chemise verte » sous les URLs suivantes :

  • mon-ecommerce.shop/mode/chemise-verte.
  • mon-ecommerce.shop/moded’été/chemise-verte
  • mon-ecommerce.shop/modehivernale/chemise-verte.

Le fait que le contenu soit ac­ces­sible via dif­fé­rentes URLs est également fréquent lorsque les struc­tures d’un site Web changent ou même lorsqu’un dé­mé­na­ge­ment complet du domaine a eu lieu. Pour de tels cas, les re­di­rec­tions 301 sont en principe prévues, mais si cela n’est pas réa­li­sable pour des raisons tech­niques, le tag link rel="canonical" est une al­ter­na­tive ju­di­cieuse à votre dis­po­si­tion.

Le contenu est dis­po­nible sur plusieurs domaines

Vous pouvez utiliser le Canonical tag non seulement pour un lien interne, mais aussi pour un lien vers un domaine externe.

De cette manière, vous proposez sans problème vos con­tri­bu­tions sur un autre domaine, sans créer de contenu dupliqué. De plus, les signaux d’uti­li­sa­teurs positifs, les liens ou autres facteurs de clas­se­ment sont trans­fé­rés sur l’URL d’origine, ce qui peut améliorer con­si­dé­ra­ble­ment sa per­for­mance.

Les contenus pré­sen­tent dif­fé­rents formats

Dans certaines si­tua­tions, il est tout à fait judicieux de publier des contenus sous dif­fé­rents formats et de proposer par exemple un for­mu­laire non seulement en version HTML, mais aussi en fichier PDF et en édition imprimée. Pour que les moteurs de recherche n’évaluent pas chaque variante in­dé­pen­dam­ment et, dans le pire des cas pro­dui­sent un mauvais clas­se­ment, il est re­com­mandé d’utiliser des balises ca­no­niques.

Conseil

Si vous disposez d’un cer­ti­fi­cat SSL/TLS valide, il est re­com­mandé d’utiliser des URLs ca­no­niques HTTPS sé­cu­ri­sées et d’y faire référence à partir des variantes non sau­ve­gar­dées (HTTP). Il en va de même pour les pages mobiles ou AMP. Pour celles-ci, il même obli­ga­toire d’utiliser des balises ca­no­niques.

Canonical tag : les erreurs fré­quentes

Dans de nom­breuses si­tua­tions, une URL canonique est la solution optimale pour éviter le duplicate content sur votre site Web. Les prin­ci­paux moteurs de recherche tiennent compte de la balise Canonical lors de l’in­dexa­tion et re­con­nais­sent ainsi que vous ne souhaitez pas vous classer en parallèle avec des contenus iden­tiques ou si­mi­laires. En outre, les signaux positifs des moteurs de recherche sont réunis dans l’URL prin­ci­pale, ce qui améliore leurs chances de po­si­tion­ne­ment. Il convient toutefois de noter ici que l’uti­li­sa­tion de balises ca­no­niques peut ra­pi­de­ment s’avérer être un facteur négatif si elles ne sont pas cor­rec­te­ment dis­tin­guées ou mal im­plé­men­tées. Les pa­ra­graphes suivants vous pré­sen­tent donc les erreurs les plus fré­quentes avec le Canonical tag.

Conseil

Avec l’audit SEO gratuit de IONOS, vous pouvez faire évaluer ra­pi­de­ment et fa­ci­le­ment les per­for­mances SEO de votre site.

Les pages nu­mé­ro­tées renvoient à une URL canonique

Pour présenter les contenus de manière at­trayante, de nombreux web­mas­ters ont recours à ce que l’on appelle la pa­gi­na­tion. Les portails d’in­for­ma­tion utilisent notamment cette méthode, qui consiste à répartir le contenu sur plusieurs pages et à les numéroter. Toutefois, si l’on utilise des balises Canonical pour de tels contenus et que l’on renvoie à l’URL de départ sur les pages suivantes avec le tag link-rel="canonical", on commet une erreur lourde de con­sé­quences : les pages suivantes ne sont en effet en aucun cas des doublons, ce qui fait que le contenu en réalité unique n’arrive pas dans l’index. Si vous souhaitez tout de même trans­mettre aux moteurs de recherche des in­for­ma­tions sur la pa­gi­na­tion choisie, il est conseillé de procéder de deux manières :

  • Renvoyer à la page pré­cé­dente et à la page suivante sur chaque URL. Pour cela, vous avez également besoin de l’attribut de lien rel, mais il faut remplacer la valeur "canonical" par "prev" ou "next".
  • Avec le tag link-rel="canonical", renvoyer à une version d’une page du contenu en question, qui combine toutes les pages nu­mé­ro­tées.

Les URLs relatives ne renvoient pas à la page canonique souhaitée

Comme la plupart des balises HTML, la balise <link> offre la pos­si­bi­lité de spécifier des URLs absolues et relatives. Alors que les URLs absolues décrivent le chemin complet (y compris « http:// », etc.), les URLs relatives renvoient spé­ci­fi­que­ment à un dossier par­ti­cu­lier sur le site Web actuel, sans qu’il soit né­ces­saire d’indiquer l’URL complète. Par exemple, un chemin relatif "images/image.jpg" indique que l’image image.jpg est ac­ces­sible dans le sous-dossier « Images » du ré­per­toire actuel. Lors de l’uti­li­sa­tion de la balise Canonical, l’uti­li­sa­tion de tels chemins conduit toutefois ra­pi­de­ment à des com­pli­ca­tions, de sorte que les crawlers ignorent com­plè­te­ment la balise dans le pire des cas.

Google renvoie à titre d’exemple à la dis­tinc­tion suivante :

< link rel="canonical" href="example.com/cupcake.html" >
html

En raison de l’absence de préfixe HTTP, le crawler considère l’URL example.com/cupcake.html comme une URL relative et part du principe que l’URL canonique souhaitée est http://example.com/example.com/cupcake.html. Idéa­le­ment, vous devriez donc toujours indiquer l’URL complète lorsque vous placez le Canonical tag ou, au moins faire référence à une URL absolue sans domaine :

< link rel="canonical" href="/cupcake.html" />
html
Conseil

Une mauvaise mise en œuvre d’une stratégie SEO peut parfois avoir de graves con­sé­quences sur le clas­se­ment de votre site. Nous vous pré­sen­tons les erreurs de ré­fé­ren­ce­ment les plus fré­quentes afin que vous puissiez les éviter.

Les pages font référence à plus d’une URL canonique

La nature des URLs ca­no­niques exclut lo­gi­que­ment qu’une sous-page renvoie à plusieurs de ces pages standard. De tels liens multiples ap­pa­rais­sent ra­pi­de­ment si vous tra­vail­lez avec un système de gestion de contenu ou avec un logiciel de boutique en ligne. En effet, les plugins et les templates insèrent souvent des balises Canonical de manière au­to­ma­tique et inaperçue, même si vous avez déjà marqué une URL canonique. En par­ti­cu­lier si vous utilisez de telles ex­ten­sions, mais aussi en cas de mo­di­fi­ca­tion de la structure de la page, vous devez donc im­pé­ra­ti­ve­ment vérifier le texte source et corriger les in­di­ca­tions le cas échéant. Dans le cas contraire, vos efforts resteront pro­ba­ble­ment in­fruc­tueux, car il est fort probable que les moteurs de recherche ignorent toutes les balises ca­no­niques au lieu d’en pri­vi­lé­gier une.

Créer un site Internet
Votre site en un éclair grâce à l'in­tel­li­gence ar­ti­fi­cielle
  • Éditeur de site intuitif avec fonctions d'IA
  • Gé­né­ra­teur d'images et de textes avec op­ti­mi­sa­tion SEO
  • Domaine, SSL et boîte email inclus

Les balises Canonical manquent dans la version mobile

Proposer une version mobile de votre site Web en plus de la version de bureau peut être à l’origine d’énor­mé­ment d’erreurs dans le balisage des liens. Et même si les pages mobiles sont indexées malgré l’absence d’in­di­ca­tions, il convient d’aider les moteurs de recherche à les re­con­naître et à les ca­té­go­ri­ser. Ainsi, Google re­com­mande de désigner la version mobile comme version al­ter­na­tive au moyen de rel="alternate" et, en outre, de renvoyer les pages mobiles vers les URLs de bureau cor­res­pon­dantes au moyen de la balise Canonical. Le géant des moteurs de recherche a réuni des conseils détaillés et les pro­cé­dures possibles dans un guide pour les « Mobile Friendly Websites ».

Conseil

Le SEO englobe de nombreux com­po­sants de pages Web, stra­té­gies d’op­ti­mi­sa­tion et notions tech­niques. Il est donc souvent difficile pour les nouveaux venus de s’y retrouver. Dans notre lexique SEO, nous vous ex­pli­quons les termes prin­ci­paux liés à l’op­ti­mi­sa­tion pour les moteurs de recherche.

Les balises Canonical et hreflang se con­tre­di­sent

Les projets Web in­ter­na­tio­naux avec des domaines de dif­fé­rents pays re­pré­sen­tent un grand défi pour les res­pon­sables SEO. D’une part, les pages de toutes les variantes doivent obtenir de bons clas­se­ments et arriver à l’uti­li­sa­teur final approprié ; d’autre part, il faut réduire au maximum le risque de contenu dupliqué. L’un des outils les plus im­por­tants est l’attribut hreflang, qui permet de désigner les dif­fé­rentes versions comme al­ter­na­tives équi­va­lentes. Pour ce faire, il est toutefois né­ces­saire que ces pages renvoient toujours à elles-mêmes. Si de telles URLs renvoient en même temps à une URL canonique via le Canonical tag, cela constitue lo­gi­que­ment une con­tra­dic­tion pour les crawlers des moteurs de recherche.

Le résultat est que le moteur de recherche ignore les deux signaux et indexe les pages Web sur la base d’autres ca­rac­té­ris­tiques. Il faut donc ab­so­lu­ment éviter d’utiliser les deux ins­truc­tions ensemble.

Remarque

La com­bi­nai­son d’URLs ca­no­niques et de hreflang n’est pas la seule à générer des con­tra­dic­tions qui ont un impact négatif sur le clas­se­ment de vos pages. L’uti­li­sa­tion commune de balises Canonical et d’ins­truc­tions telles que nofollow, noindex ou disallow n’est pas non plus ex­pres­sé­ment souhaitée par Google.

Les dif­fé­rences entre la balise canonique et la re­di­rec­tion 301

À première vue, la balise canonique semble res­sem­bler fortement aux re­di­rec­tions 301. En effet, ces re­di­rec­tions, basées sur le code d’état HTTP 301 (Moved Per­ma­nently ou « déplacé dé­fi­ni­ti­ve­ment »), signalent également aux moteurs de recherche que dif­fé­rentes pages Web doivent être con­si­dé­rées comme un seul exem­plaire. En outre, les re­di­rec­tions ont également pour effet de diriger les visiteurs vers l’URL déclarée comme originale, tandis que toutes les autres variantes sont sup­pri­mées. Les pages avec la balise Canonical sont uni­que­ment marquées comme copie pour les moteurs de recherche et restent donc toujours ac­ces­sibles pour les uti­li­sa­teurs.

Une autre dif­fé­rence réside dans le fait que les moteurs de recherche n’ignorent jamais une re­di­rec­tion, alors que cela peut tout à fait être le cas avec le marquage d’élément de lien re­com­man­dant. Enfin, les deux méthodes se dis­tin­guent également par leur fonc­tion­na­lité en cas d’uti­li­sa­tion in­ter­do­maine : alors que les re­di­rec­tions 301 trans­por­tent ef­fec­ti­ve­ment une page d’un domaine A vers un domaine B, la balise Canonical indique uni­que­ment qu’il existe un équi­valent d’une page du domaine A sur le domaine B. Les re­di­rec­tions 301 ne peuvent pas être utilisées dans le cadre d’une uti­li­sa­tion in­ter­do­maine.

Aller au menu principal