L’un des principes majeurs de l’op­ti­mi­sa­tion des moteurs de recherche est de présenter du contenu unique. Ceci permet d’améliorer le clas­se­ment d’un site Web dans les résultats de recherche et d’assurer une ex­pé­rience uti­li­sa­teur plus positive. C’est la base d’une stratégie de contenu réussie.

Le contraire d’un contenu unique est appelé contenu dupliqué (« duplicate content » en anglais). Ce terme renvoie à des blocs de texte entiers ou des pages Web entières dupliqués sur plusieurs URL. Il est important d’éviter ce type de contenu au profit d’un contenu unique en vue d’une op­ti­mi­sa­tion des moteurs de recherche réussie.

Le contenu dupliqué a une incidence sur le clas­se­ment et la con­vi­via­lité d’un site Web.

Nom de domaine
Votre domaine en un clic
  • 1 cer­ti­fi­cat SSL Wildcard par contrat
  • Fonction incluse Domain Connect pour une con­fi­gu­ra­tion DNS sim­pli­fiée

Duplicate content : qu’est-ce que c’est ?

Le terme duplicate content renvoie à des pages Web ou des passages de texte qui sont dupliqués sur plus d’un URL.

On en distingue gé­né­ra­le­ment deux types :

  • Le contenu dupliqué interne renvoie à du contenu dupliqué au sein d’un même domaine
  • Le contenu dupliqué externe se trouve sur plusieurs domaines.

Chacun des termes renvoie à des pages ou des blocs de texte qui sont partagés sans mo­di­fi­ca­tions. Lorsque le contenu n’est pas identique à 100% mais presque identique, il est appelé near duplicate content (contenu presque dupliqué).

Exemples les plus fréquents de duplicate content

La majorité des pro­prié­taires de sites Web con­nais­sent les effets néfastes du contenu dupliqué et évitent ainsi d’en produire. Cependant, le contenu dupliqué interne s’avère être très fréquent. Ce dernier est souvent dû à des causes tech­niques. Vous trouverez plus d’in­for­ma­tions à ce sujet dans la section « Les causes tech­niques du contenu dupliqué »

Il arrive souvent que le même contenu revienne plusieurs fois sur les dif­fé­rentes sous-pages d’un même domaine. Les boutiques en ligne en par­ti­cu­lier sont con­fron­tées à ce problème. Lorsqu’un produit est assigné à plusieurs ca­té­go­ries ou est dis­po­nible en dif­fé­rentes versions, la des­crip­tion est souvent à peu de chose près la même d’une page à l’autre. Ceci est considéré comme du contenu dupliqué. On a tendance à sous-estimer les PDF qui con­tien­nent des in­for­ma­tions produit. Si leur contenu cor­res­pond à celui de la landing page d’un produit, cela sera considéré comme du contenu dupliqué. Autre exemple : la phi­lo­so­phie de l’en­tre­prise qui peut être publiée sur plusieurs sous-pages.

Les boutiques en ligne font également face à des formes de contenu dupliqué externe. Lorsque vous achetez des produits chez un grossiste, les autres re­ven­deurs uti­li­se­ront pro­ba­ble­ment les mêmes des­crip­tifs produits sur leurs propres sites Web. Dans ce cas, le contenu identique fait non seulement baisser le clas­se­ment du site sur les moteurs de recherche, mais il affecte également la décision d’achat de clients po­ten­tiels. Si la pré­sen­ta­tion d’un produit est identique chez deux vendeurs, c’est le prix qui fera la dif­fé­rence. Il vaut mieux utiliser des des­crip­tifs produit uniques et vérifier ré­gu­liè­re­ment que d’autres vendeurs ne les ont pas copiés.

La création de duplicate content externe se produit également lorsque vous copiez du contenu tiers, même dans le cadre d’une coo­pé­ra­tion et avec le con­sen­te­ment de l’auteur. S’il existe des versions d’autres pays et dans d’autres langues de votre site Web sous dif­fé­rents noms de domaines, cela engendre également le risque que du contenu dupliqué externe existe.

ran­king­Coach
Boostez vos ventes grâce au marketing digital par IA
  • Améliorez votre clas­se­ment sur Google sans les frais d'une agence
  • Répondez aux avis clients et générez des pu­bli­ca­tions pour les réseaux
  • Aucune con­nais­sance en ré­fé­ren­ce­ment et marketing en ligne requise

Pourquoi le duplicate content pose-t-il problème ?

Les moteurs de recherche tels que Google utilisent un al­go­rithme pour évaluer tous les sites po­ten­tiel­le­ment per­ti­nents et utilisent certains critères pour dé­ter­mi­ner l’ordre dans lequel les résultats de recherche ap­pa­rais­sent. L’objectif de cette éva­lua­tion est de présenter à l’uti­li­sa­teur le contenu le plus pertinent en tête des résultats.

Si le même contenu apparaît sur dif­fé­rents sites Web, les moteurs de re­cherches ne réus­si­ront pas à effectuer une éva­lua­tion correcte. Cela complique l’at­tri­bu­tion de la confiance, de la per­ti­nence et de l’autorité et, en dé­fi­ni­tive, la création d’un clas­se­ment. Dès lors, les moteurs de recherche évitent en général d’indexer le même contenu plusieurs fois et de l’afficher dans les résultats de recherche, car cela n’offre aucune valeur ajoutée pour l’uti­li­sa­teur. Par con­sé­quent, le clas­se­ment des pages qui con­tien­nent du contenu dupliqué va baisser.

Compte tenu des effets négatifs du contenu dupliqué, il convient de se méfier des logiciels appelés « web scrapers ». Ce type de programme copie les sites Web à l’identique. Un moteur de recherche comme Google peut désormais re­con­naître les sites dits « scrapers » en se basant sur dif­fé­rents pa­ra­mètres et les dis­tin­guer des « vrais » sites Web.

Entre 25 et 35% du contenu de tous les sites Web est en réalité du duplicate content. Le contenu dupliqué n’est pas toujours né­ces­sai­re­ment une mauvaise chose. Cette vidéo explique comment Google traite le contenu dupliqué et ce qu’il faut éviter quoi qu’il arrive :

mQZY7EmjbMA.jpg Pour afficher cette vidéo, des cookies de tiers sont nécessaires. Vous pouvez consulter et modifier vos paramètres de cookies ici.

Comment repérer du duplicate content ?

Nous vous con­seil­lons de vérifier votre site Web ré­gu­liè­re­ment pour voir s’il contient du duplicate content. Cela arrive souvent sans que le ges­tion­naire du site Web ne le sache, par exemple lors de la création de nouvelles pages ou lorsque des liens internes sont in­co­hé­rents. Ci-dessous, nous vous pré­sen­te­rons les méthodes les plus courantes pour traquer du contenu dupliqué.

Vérifier ma­nuel­le­ment votre site web

Si votre site Web est constitué d’un nombre limité de sous-pages, une bonne solution peut être de vérifier celles-ci ma­nuel­le­ment. Faites par­ti­cu­liè­re­ment attention aux sections de texte que vous utilisez plusieurs fois sur votre site web. C’est ty­pi­que­ment le cas lors de la pré­sen­ta­tion des valeurs de la société ou lors d’un appel à l’action.

Vous soup­çon­nez un bloc de texte d’ap­pa­raître plus d’une fois ? Dans ce cas, n’hésitez pas à vérifier avec une recherche Google. Saisissez le texte entre guil­le­mets dans la barre de recherche et voyez si dif­fé­rents URL pour votre site Web ap­pa­rais­sent dans les résultats de recherche.

Conseil

Google cache les résultats de recherche dupliqués pour montrer seulement les pages per­ti­nentes à l’uti­li­sa­teur. Si vous relancez votre recherche, les résultats cachés pré­cé­dem­ment seront affichés comme ap­par­te­nant au clas­se­ment.

Re­cher­cher du contenu dupliqué à l’aide d’un outil d’analyse

Lorsqu’il y a un grand nombre de sous-pages ou sur un site d’e-commerce, une recherche manuelle peut être très chro­no­phage. Étant donné que beaucoup de ges­tion­naires de sites Web sont con­fron­tés à ce problème, il existe divers outils à même de re­cher­cher au­to­ma­ti­que­ment du contenu dupliqué.

La Google Search Console est un outil d’analyse gratuit et utile qui permet l’op­ti­mi­sa­tion des moteurs de recherche et une recherche de contenu dupliqué interne. Il va d’abord trouver le mot-clef principal sous lequel les gens trouvent et vi­sua­li­sent votre site. Vous pouvez ensuite filtrer pour obtenir leurs requêtes exactes. Si l’outil ré­per­to­rie plusieurs sous-pages, vous pouvez alors vérifier si du contenu dupliqué se trouve parmi elles. Dans le rapport de cou­ver­ture de l’index, sous « Pages exclues », vous pouvez voir les sous-pages ayant été iden­ti­fiées comme des doublons et exclues en con­sé­quence.

Pour découvrir du contenu dupliqué externe, vous aurez besoin d’un outil d’analyse tel que Copyscape ou Siteliner. Saisissez sim­ple­ment votre URL et les outils af­fi­che­ront la liste de toutes les pages internes et externes dont le contenu cor­res­pond à votre URL.

Comment éviter le duplicate content ?

À présent, vous savez comment débusquer du contenu dupliqué. Mais il vaut encore mieux l’éviter dès le départ. Pour cela, suivez ces conseils :

  • Créez des sous-pages que l’on peut fa­ci­le­ment dis­tin­guer par thème et utilisez des mots-clefs prin­ci­paux dif­fé­rents pour chaque page. La meilleure façon de maîtriser cela est de définir une stratégie de mots-clés en amont.
  • Évitez d’insérer des pa­ra­graphes généraux sur dif­fé­rentes sous-pages
  • Évitez de copier/coller des textes pré­ré­di­gés (sauf s’il s’agit d’une citation présentée comme telle ou d’une citation légale).
  • Faites attention à la com­pa­ti­bi­lité des liens internes et assurez-vous de ne pas avoir d’entrées dif­fé­rentes pour le même URL. Celles-ci sont ty­pi­que­ment créées en ajoutant index.htm à l’URL de la page d’accueil ou en créant des variantes avec ou sans slash de fin (/).
  • Utilisez des domaines de niveau supérieur pour les versions de dif­fé­rents pays et en dif­fé­rentes langues de votre site tels que https//www.exemple.com par op­po­si­tion à des sous-domaines tels que https//www.exemple.org/fr.

En général, vous ne pouvez pas influer sur la création de contenu dupliqué externe si d’autres web­mas­ters copient votre contenu. Par con­sé­quent, nous vous con­seil­lons de lancer le crawl ma­nuel­le­ment après avoir créé une nouvelle page. Si votre site Web est indexé avec le contenu respectif en tant que première page, il sera classifié comme l’original.

Les causes tech­niques du duplicate content

Certaines causes tech­niques pro­vo­quent souvent la création de contenu dupliqué sans que le ges­tion­naire du site Web ne le sache. Nous vous con­seil­lons de vérifier votre présence en ligne à l’aune des points suivants :

Plusieurs variantes d’une adresse web

Lorsque vous passez en HTTPS crypté (Hypertext Transfer Protocol Secure), il est important de con­fi­gu­rer le transfert depuis votre ancienne adresse Web. Si votre ancien site reste ac­ces­sible via http://, du contenu dupliqué identique à 100% sera créé !

Assurez-vous de vérifier s’il est possible d’accéder à votre site Web en utilisant des or­tho­graphes dif­fé­rentes. Voici les exemples les plus courants :

  • Votre page d’accueil est ac­ces­sible via index.php de même qu’avec ou sans slash de fin.
  • Votre site Web est ac­ces­sible avec et sans www dans le corps de l’URL.
  • Votre URL est sensible à la casse.

Si vous repérez deux URLs ou plus con­dui­sant à la même sous-page, con­fi­gu­rez une re­di­rec­tion 301 jusqu’à la page prin­ci­pale pour toutes les variantes.

Autres mesures tech­niques

  • Si votre site Web a des versions d’autres pays ou en langues dif­fé­rentes, marquez-les avec un hreflang pour éviter le contenu dupliqué.
  • Vérifiez les pa­ra­mètres de vos URL. Ceux-ci per­met­tent souvent la création de nombreux URL uniques qui con­dui­sent au même contenu. Il s’agit d’une cause fréquente de contenu dupliqué, en par­ti­cu­lier du fait des fonctions de filtrage des boutiques en ligne.
  • Faites attention aux ID de session qui font partie d’un URL. Du fait de ceux-ci, les crawlers peuvent recevoir un nouvel ID à chaque fois que quelqu’un accède à une sous-page et ainsi atteindre un nouvel URL.
  • Empêchez les versions im­pri­mables de vos sites d’être indexées.

Comment traiter le duplicate content cor­rec­te­ment ?

La con­tre­fa­çon in­ten­tion­nelle de contenu tiers est interdite pour des raisons de droits d’auteur et con­for­mé­ment aux règles édictées par Google. Néanmoins, la présence de contenu dupliqué en ligne est normale et n’est pas di­rec­te­ment punie. Quoi qu’il en soit, nous vous con­seil­lons d’éviter le contenu dupliqué aussi souvent que possible.

Lorsqu’un site Web contient deux sous-pages ou plus où se trouve du contenu similaire ou identique, vous pouvez fusionner le contenu en une seule page ou étendre les sous-pages res­pec­tives en ajoutant du contenu unique et des mots-clefs in­di­vi­duels pour optimiser leur contenu SEO. La meilleure option pour vous dépend de la per­ti­nence des pages et de la pos­si­bi­lité de renforcer les mots-clés.

Choi­sis­sez des mots-clés forts pour les titres, méta-des­crip­tions et méta-titres. Ainsi, ils ne seront pas clas­si­fiés comme du duplicate content et vous amé­lio­re­rez votre clas­se­ment auprès des moteurs de recherche. Pour modifier des textes existants et les dif­fé­ren­cier, utilisez des bullet points, des listes et des tableaux, ou intégrez des images ou des vidéos.

Note

Les moteurs de recherche peuvent repérer les doublons éventuels dans les en-têtes et les pieds de page et ne pas les con­si­dé­rer comme du contenu dupliqué. Dans ce cas, il n’est pas né­ces­saire de créer du contenu différent pour chaque sous-page.

Si vous souhaitez partager du contenu existant, par exemple, un article de blog ou un com­mu­ni­qué de presse sur d’autres sites, utilisez cette balise canonique rel="canonical" dans l’en-tête. Ce faisant, vous déclarez que l’URL sé­lec­tionné est la ressource standard ou l’URL original. La balise est invisible pour les uti­li­sa­teurs et explique néanmoins clai­re­ment au moteur de recherche la façon dont les pages sont liées les unes aux autres.

Conseil

Le duplicate content n’est qu’un aspect parmi d’autres du SEO. Faites confiance au ran­king­Coach de IONOS pour vous aider à optimiser votre site Web étape par étape grâce à des tutoriels vidéo très utiles.

Aller au menu principal