Schema.org est un projet col­la­bo­ra­tif des moteurs de recherche Google, Microsoft, Yahoo et Yandex.  Le but de l’ini­tia­tive est une uni­for­mi­sa­tion des an­no­ta­tions sé­man­tiques servant à présenter vos contenus Web. Sur le site Web du même nom (http://schema.org/) se trouvent des balises pour les ad­mi­nis­tra­teurs Web et un vaste vo­ca­bu­laire destinés à l’édition de codes HTML.  On parle dans ce cas de données struc­tu­rées, qui cons­ti­tuent la base du Web sé­man­tique.  Les pré­sen­ta­tions proposées sur Schema.org sont com­pa­tibles avec les formats RDFa, Microdata et JSON-LD.

Trois raisons de choisir Schema.org

Les données struc­tu­rées gagnent de plus en plus d’im­por­tance chez les ad­mi­nis­tra­teurs Web. Con­trai­re­ment à des visiteurs humains, les pro­grammes d’in­dexa­tion Web né­ces­si­tent des balises ap­pro­priées pour in­ter­pré­ter le contexte sé­man­tique d’une page Web. Ces données struc­tu­rées jouent en effet un rôle décisif dans l’in­dexa­tion d’une page. Les ad­mi­nis­tra­teurs de sites Internet peuvent également profiter de ces an­no­ta­tions sé­man­tiques. Si les contenus sont traités uni­for­mé­ment, cela permet aux moteurs de recherche d’extraire des in­for­ma­tions de manière ciblée et d’utiliser ces dernières pour exposer les pages Web dans les pages de résultats de recherche (SERP pour Search Engine Results Pages). Les plus per­ti­nents sont ce qu’on appelle les « rich snippets » ou extraits enrichis du contenu d’une page Web. Il s’agit d’éléments d’in­for­ma­tions qui élar­gis­sent le contenu du résultat et qui captent ainsi l’attention. Afin d’assurer l’uni­for­mité né­ces­saire des an­no­ta­tions sé­man­tiques malgré les dif­fé­rents formats de données, Schema.org propose des schémas stan­dar­di­sés appelés « types » qui peuvent être munis de sets spé­ci­fiques de pro­prié­tés. Ces an­no­ta­tions de Schema.org proposent aux ad­mi­nis­tra­teurs Web trois avantages non né­gli­geables:

  • Stan­dar­di­sa­tion : ces an­no­ta­tions sont basées sur un accord entre les plus gros moteurs de recherche au monde. Si les contenus sont annotés selon Schema.org, l’an­no­ta­tion choisie par les Web­mas­ters sera de facto con­si­dé­rée comme standard.
  • Com­pa­ti­bi­lité : l’uni­for­mité des schémas et la com­pa­ti­bi­lité avec les formats de données les plus courants (RDFa, Microdata et JSON-LD) fournit une com­pa­ti­bi­lité maximale de l’an­no­ta­tion sé­man­tique. Les ex­ploi­tants de sites Web qui traitent leurs contenus selon Schema.org peuvent, sont adaptés à tous les types de clients Web.  
  • Va­li­da­tion : un standard uniforme offre l’avantage de faciliter et d’accélérer l’analyse d’erreurs. Les balises inscrites avec Schema.org aux formats Microdata, RDFa et JSON-LD sont également com­pa­tibles avec l’outil de test gratuit de données struc­tu­rées de Google, qui permet de les valider ou non. 

Hié­rar­chie des types selon Schema.org

Le système d’an­no­ta­tions de Schema.org est constitué de types et de pro­prié­tés. Tandis que les types sont classés par éléments de contenus afin d’être ca­rac­té­ri­sés par des items bien définis, les pro­prié­tés servent à attribuer une valeur précise à ces types définis. Le projet Schema.org propose donc un set de types struc­tu­rés hié­rar­chi­que­ment. De plus, l’at­tri­bu­tion de pro­prié­tés à certains types est dé­ter­mi­née de manière durable.

Le spectre de types, auxquels un item peut être attribué, va de dé­fi­ni­tions très précises à d’autres très générales comme « chose » (pour « Thing ») ou « film » (pour « movie »).  Chaque type, à l’exception du type « chose », peut avoir un ou plusieurs types-parents :

  • Thing > Crea­ti­ve­Work > Movie

Tandis que « Thing » est ca­rac­té­risé d’item non spé­ci­fique, « Creative Work » est quant à lui plus spé­ci­fique et désigne une œuvre de création comme un livre, une pho­to­gra­phie ou encore un film. Le type « Movie » est donc une sous-catégorie du type « Creative Work », qui est lui-même une sous-catégorie de « Thing ». Cette hié­rar­chie est per­ti­nente car les pro­prié­tés de types spé­ci­fiques sont in­hé­rentes aux pro­prié­tés de leurs types-parents.  Un item ca­rac­té­risé de « Movie » se verra donc attribuer toutes les pro­prié­tés d’un film (acteurs, ré­gis­seurs, trailer,…).

Le type « Movie » englobe donc par ailleurs aussi les pro­prié­tés de son type-parent « Creative Work », car toute œuvre de création a, comme un film, un auteur, un genre ou des critiques. De plus, le type « Movie » hérite des pro­prié­tés du type-parent « Thing » (nom, des­crip­tion, URL et image). Toutes les pro­prié­tés se voient attribuer des valeurs in­di­vi­duelles res­pec­ti­ve­ment selon l‘élément.

Les types et pro­prié­tés définis sur Schema.org s’utilisent de la même manière avec RDFa, Microdata et JSON-LD. L’in­té­gra­tion d’une balise dans un site Web diffère cependant con­si­dé­ra­ble­ment selon le format du fichier utilisé.

Le choix du format de données

Si une décision a été prise quant à la balise selon Schema.org, il reste à choisir le format de ces données. Les articles ci-dessous proposent une des­crip­tion détaillée des an­no­ta­tions avec RDFa, Microdata et JSON-LD sur la base des types et pro­prié­tés stan­dar­di­sés de Schema.org.

  • Tutoriel : balise avec RDFa
  • Tutoriel : balise avec Microdata
  • Tutoriel : balise avec JSON-LD
Aller au menu principal