Si vous vous souciez du clas­se­ment de vos sites Web dans les pages de résultats des moteurs de recherche (SERPs), vous saurez exac­te­ment combien de facteurs dif­fé­rents in­fluen­cent la lutte pour les premières places. Par exemple, la liste des facteurs qui affectent les clas­se­ments Google comprend plus de 200 critères, dont certains ont été of­fi­ciel­le­ment confirmés par l’en­tre­prise, quand d’autres ont été avancés par des experts. Ce n’est un secret pour personne que l’op­ti­mi­sa­tion pour les moteurs de recherche est la norme pour tous les web­mas­ters sou­hai­tant que leur site soit visible et ac­ces­sible. Bien que des facteurs tels que des mots clés per­ti­nents, un contenu de haute qualité ou un haut niveau de mobilité soient des facteurs bien connus, la valeur d’un bon sitemap XML est souvent sous-estimée.

Qu’est-ce qu’un sitemap XML?

Un sitemap XML (sitemap.xml) est un fichier texte au format XML (langage de balisage ex­ten­sible) contenant une liste de toutes les sous-pages d’un site Web sous forme de lien. En tant que tel, il peut être té­lé­chargé sur Google Search Console ou Bing Webmaster Tools pour informer les robots d’in­dexa­tion des moteurs de recherche de toutes les pages dis­po­nibles et per­ti­nentes afin d’accélérer et d’optimiser le processus d’in­dexa­tion. Les sitemaps XML doivent répondre aux exigences du protocole Sitemap, qui a été accepté en tant que norme par Google, Yahoo et Microsoft en 2006, dans le but d’améliorer la qualité des résultats de recherche fournis à long terme. Pour cela, le codage en UTF-8 et le langage de balisage XML entre autres, ainsi que l’uti­li­sa­tion de codes d’entité pour certains ca­rac­tères (tels que "&gt" au lieu de ">"), sont requis.

Note

Les sitemaps XML sont dif­fé­rents des sitemaps que de nombreux CMS affichent au­to­ma­ti­que­ment dans le Front-End. C’est la table des contenus du site, qui vise à faciliter la na­vi­ga­tion pour les visiteurs. Par défaut, les sitemaps ne sont pas visibles pour les uti­li­sa­teurs, même s’il est tech­ni­que­ment possible de les rendre ac­ces­sibles via une URL.

Les avantages d’un sitemap XML

Même si rien ne garantit que l’in­dexa­tion de Google et des autres moteurs de recherche sera optimisée en raison de l’uti­li­sa­tion de sitemaps XML, les ré­per­toires de liens struc­tu­rés aug­men­tent les chances que cela soit le cas. La table des matières pensée pour le robot d’in­dexa­tion peut également être rentable, en par­ti­cu­lier pour les sites dont le contenu dynamique est soumis à des mo­di­fi­ca­tions cons­tantes. La même chose s’applique aux sites Web de plus grande taille qui com­por­tent de nom­breuses sous-pages, mais pas (encore) une grande structure de backlink. Les sites comme ceux-ci ont tendance à être contrôlés de manière trop ir­ré­gu­lière pour que les chan­ge­ments soient remarqués ou ne soient même pas détectés par les radars des moteurs de recherche. Grâce à sitemap.xml, vous pouvez les aider à se faire remarquer plus ra­pi­de­ment par les robots d’in­dexa­tion.

Un avantage sup­plé­men­taire, en plus de ré­per­to­rier les URL des sous-pages : les sitemaps XML peuvent également ré­per­to­rier des fichiers mul­ti­mé­dias tels que des vidéos ou des images. Pour ceux-ci, il existe même des balises sup­plé­men­taires indiquant au robot le type de contenu utilisé (par exemple, <image>, <vidéo>). De plus, des attributs décrivant le contenu plus en détail ou spé­ci­fiant la durée ou la taille peuvent être utilisés afin que les moteurs de recherche puissent l’iden­ti­fier de manière optimale. Il existe également une version spéciale du sitemap XML pour les portails d’ac­tua­li­tés, qui promet une in­dexa­tion optimale des articles grâce à des attributs spé­ci­fiques tels que le genre, la date de pu­bli­ca­tion ou le titre.

Conseil

L’effort né­ces­saire pour créer ma­nuel­le­ment un sitemap XML, sim­ple­ment pour vous assurer que votre site Web possède un ré­per­toire struc­tu­rel, peut être considéré comme un in­con­vé­nient. Grâce aux gé­né­ra­teurs de sitemap XML comme le gé­né­ra­teur en ligne XML-Sitemaps.com, il n’est pas né­ces­saire de générer des sites XML pratiques par vous-même. En outre, il existe des plug-ins pour la plupart des systèmes de gestion de contenu qui créent au­to­ma­ti­que­ment des sitemaps XML.

Structure d’un sitemap XML : les com­po­sants les plus im­por­tants

Le formatage d’un sitemap XML fonc­tionne avec les balises XML, comme chaque document dans le langage de balisage ex­ten­sible. Selon le standard actuel « Sitemaps 0.9 », trois balises sont né­ces­saires pour qu’il soit considéré comme un sitemap XML.

sitemap.xml: balises obli­ga­toires
<urlset>, </urlset> Chaque fichier sitemap XML doit commencer par une balise d’ouverture <urlset> et se terminer par une balise </urlset> de fermeture. La fonction de la balise est de résumer le fichier et de le lier au standard de protocole actuel.
<url>, </url> Les balises d’ouverture et de fermeture <url> sont su­bor­don­nées aux entrées d’URL in­di­vi­duelles et indiquent le début et la fin d’une sous-page ré­per­to­riée.
<loc>, </loc> La balise <loc> identifie les pages in­di­vi­duelles du site Web ou ses URL. L’URL doit toujours commencer par le protocole (par exemple, "http") et se terminer par une barre oblique de fermeture (si le serveur Web l’exige). Une longueur maximale de 2 048 ca­rac­tères est également définie.

Outre ces attributs XML obli­ga­toires, les balises sitemap <priority>, <lastmod> et <chan­ge­freq> four­nis­sent trois balises sup­plé­men­taires pour spécifier les entrées d’URL in­di­vi­duelles. Cependant, la prise en charge de ces balises op­tion­nelles dépend du moteur de recherche respectif. Par exemple, le robot Google utilise prin­ci­pa­le­ment les balises <lastmod> pour l’in­dexa­tion, alors qu’il ignore en grande partie les deux autres attributs ou leur permet uni­que­ment de s’intégrer au processus d’analyse.

sitemap.xml: balises op­tion­nelles
<lastmod>, </lastmod> Via la balise <lastmod>, la date (au format W3C) de la dernière mo­di­fi­ca­tion de la page peut être spécifiée. La balise est in­dé­pen­dante de l’en-tête « if modified since » que le serveur Web peut renvoyer dans le cadre d’une réponse HTTP 304.
<chan­ge­freq>, </chan­ge­freq> La balise <chan­ge­freq> fournit au robot d’in­dexa­tion des in­for­ma­tions générales sur la fréquence à laquelle une page doit être mise à jour (par heure, par jour, par mois, etc.). Les documents modifiés à chaque accès sont marqués avec la valeur « always » et les URL archivées sont marquées  avec « never ».
<priority>, </priority> Cette balise permet d’exprimer la priorité d’une URL sur un site Web entier sur une échelle de 0,0 à 1,0 (priorité par défaut: 0,5). De cette façon, les robots peuvent être informés des pages dont l’in­dexa­tion est par­ti­cu­liè­re­ment im­por­tante.

Comme un fichier de sitemap XML peut contenir un maximum de 50 000 URL et ne doit pas dépasser 50 Mo, la col­lec­tion d’URL de sites Web plus gros peut également être répartie sur plusieurs documents. Dans ce cas, chaque document sitemap doit être ré­per­to­rié dans un fichier d’index sup­plé­men­taire dont la structure est similaire à celle des fichiers sitemap : les balises <si­te­ma­pin­dex> et <sitemap> doivent être utilisées à la place de <urlset> et <url>.

Note

Il est possible de com­pres­ser des fichiers sitemap (avec gzip, par exemple), mais uni­que­ment pour réduire les besoins en bande passante. La taille maximale d’un sitemap XML ne peut pas être augmentée de cette manière, car la limite s’applique toujours à la version dé­com­pres­sée du fichier.

Exemple de sitemap XML

La manière la plus simple de com­prendre la structure d’un sitemap XML consiste à utiliser un exemple concret :

<!--?xml version="1.0" encoding="UTF-8"?-->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"></urlset>
	<url></url>
		<loc>http://one-test.website/</loc>
		<lastmod>2018-01-01</lastmod>
		<changefreq>monthly</changefreq>
		<priority>1.0</priority>
	
	<url></url>
		<loc>http://one-test.website/page1/</loc>
		<lastmod>2018-03-05</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.5</priority>
	
	<url></url>
		<loc>http://one-test.website/page2/</loc>
		<lastmod>2018-03-08</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.3</priority>

Dans ce cas, l’exemple de sitemap XML ré­per­to­rie l’URL prin­ci­pale one-test.website et les URL de deux sous-pages (page1 et page2). Les robots d’in­dexa­tion des moteurs de recherche peuvent voir dans le document que le webmaster a accordé la plus haute priorité à la page prin­ci­pale et que des mo­di­fi­ca­tions sont apportées environ une fois par mois. Le dernier ajus­te­ment a été effectué le 1er janvier 2018. Page1 a la valeur de priorité par défaut (0.5), mais con­trai­re­ment à la page prin­ci­pale, il a été estimé qu’il serait ajusté chaque semaine, la dernière mo­di­fi­ca­tion ayant eu lieu le 5 mars 2018 Si le robot d’in­dexa­tion utilise l’attribut sitemap priority, il sait qu’il doit accorder le moins d’attention à la page 2 lors de l’in­dexa­tion (valeur <priority>: 0,3). La sous-page est modifiée chaque semaine (dernière mo­di­fi­ca­tion le 8 mars 2018).

Créer et soumettre un sitemap XML : comment ça marche

Compte tenu de la quantité de travail né­ces­saire pour créer ma­nuel­le­ment des sitemaps XML, choisir des plug-ins ou des outils en ligne est une bonne idée, à condition que vous les utilisiez cor­rec­te­ment. Les sitemaps XML rai­son­nables peuvent être générés sans con­fi­gu­ra­tion spé­ci­fique, mais les ré­per­toires de structure ne peuvent avoir la forme souhaitée que lorsque les pa­ra­mètres in­di­vi­duels ap­pro­priés sont corrects. Pour notre exemple, nous pré­sen­tons les pos­si­bi­li­tés offertes par le gé­né­ra­teur en ligne de XML-sitemaps.com et le plugin WordPress Google XML sitemaps pour la création et l’in­té­gra­tion de sitemaps XML.

Comment générer des sitemaps XML en utilisant le gé­né­ra­teur en ligne de XML-sitemap.com

Le gé­né­ra­teur en ligne de XML-sitemaps.com offre aux uti­li­sa­teurs une solution pratique pour créer leurs propres sitemaps XML. Le service Web est gratuit pour les projets Web com­por­tant jusqu’à 500 sous-pages. Il est également possible de créer des sitemaps pour des projets plus im­por­tants, mais cet uti­li­sa­teur devra payer pour l’abon­ne­ment Pro. La procédure est très simple : après avoir accédé à l’ap­pli­ca­tion Web, insérez l’URL de votre site Web dans le champ d’adresse fourni.

Té­lé­char­gez le fichier sitemap XML généré et té­lé­char­gez-le dans le ré­per­toire de votre site Web. Pour informer le robot d’in­dexa­tion Google sur le fichier, par exemple, envoyez sim­ple­ment le fichier dans la Google Search Console. Vous pouvez également spécifier le chemin d’accès du sitemap dans le fichier robots.txt :

Sitemap: http://one-test.website/sitemap.xml

Google XML Sitemaps : comment créer des sitemaps XML avec le plugin WordPress

Depuis plus de dix ans, le plugin WordPress Google XML Sitemaps, développé par Arne Brachhold, a permis de créer des sitemaps XML et c’est aussi simple qu’un jeu d’enfants. Pour utiliser ce plugin populaire (plus de 2 millions d’ins­tal­la­tions actives dans le monde) pour votre site WordPress, vous devez d’abord l’installer via le centre de plug-ins du système de gestion de contenu. Sé­lec­tion­nez l’élément de menu "Plug-ins" puis "Installer" et entrez "Google XML Sitemaps" dans le champ de recherche. En cliquant sur "Installer main­te­nant", vous lancez le processus d’ins­tal­la­tion de l’extension, qui doit ap­pa­raître en haut des résultats présentés :

Vous pouvez également té­lé­char­ger Google XML Sitemaps ma­nuel­le­ment et le placer dans le ré­per­toire de votre plugin WordPress. Si vous activez l’extension, vous pouvez y accéder di­rec­te­ment dans WordPress via "Sitemap XML" dans le menu "Pa­ra­mètres". Par rapport à XML-Sitemaps.com, un nombre beaucoup plus important d’options de con­fi­gu­ra­tion sont dis­po­nibles dans les sept domaines suivants :

  • Options de base : vous dé­fi­nis­sez ici les pa­ra­mètres de base et dé­ter­mi­nez, par exemple, si Google et Bing doivent être informés au­to­ma­ti­que­ment des mo­di­fi­ca­tions ou si le plan du site doit être au­to­ma­ti­que­ment compressé.
  • Pages sup­plé­men­taires : ici, vous pouvez ajouter des fichiers ou des URL qui n’ap­par­tien­nent pas au projet WordPress mais s’exécutent sur le même domaine
  • Posts prio­ri­taires : les ajus­te­ments dans ce menu sont par­ti­cu­liè­re­ment in­té­res­sants pour les blogs et les portails d’in­for­ma­tions, si vous utilisez la balise <priority> pour votre sitemap, vous pouvez définir ici si et comment le plugin doit calculer la priorité d’un article.
  • Contenu du sitemap : utilisez ce menu pour sé­lec­tion­ner les ca­té­go­ries de pages à inclure dans le sitemap XML (par exemple, pages d’accueil, pages statiques, pages d’archives, etc.).
  • Éléments exclus: si vous souhaitez exclure des ca­té­go­ries ou des pu­bli­ca­tions in­di­vi­duelles de l’in­dexa­tion, vous pouvez le faire ici
  • Changer les fré­quences : Google XML Sitemaps offre la pos­si­bi­lité de pré­dé­fi­nir la balise <chan­ge­freq>, et la fréquence de mise à jour peut même être définie sé­pa­ré­ment pour les dif­fé­rents types de page.
  • Priorités : en dessous, vous pouvez définir les mêmes pa­ra­mètres pour l’attribut <priority>

Une fois que vous avez conçu la con­fi­gu­ra­tion du sitemap XML en fonction de vos souhaits, en­re­gis­trez les mo­di­fi­ca­tions à l’aide du bouton cor­res­pon­dant. En cliquant sur le lien "Votre sitemap" après la sau­ve­garde, vous trans­met­tez votre sitemap XML aux robots de recherche sé­lec­tion­nés.

Aller au menu principal