Visibilité et marketing

C’est quoi les « données structurées » ? Quel intérêt pour le SEO ?

Par John , le 29 avril 2021 - 10 minutes de lecture
person in blue using black Surface device

De nos jours, la quantité de données disponible sur le web ne cesse de se multiplier. Les contenus se doivent d’être plus pertinents pour réussir à se positionner sur Google. Le moteur de recherche continue de faire évoluer son algorithme pour une meilleure compréhension des informations des pages web. En tant qu’utilisateurs, nous pouvons l’aider à mieux les appréhender. Ce qui nous amène à opter pour les données structurées et les outils y afférents.

Termes clés pour comprendre les données structurées

Les données structurées

Les données structurées désignent un ensemble de code qui permet à Google search de comprendre aisément les informations sur le web. Les codes s’affichent souvent sous un format spécifique tel que Schéma.org, le format le plus facile à analyser par les moteurs de recherche. Ce qui explique l’intérêt du web sémantique et l’optimisation des pages web, aussi bien pour les internautes que pour la machine. L’idée est d’automatiser au mieux la récolte des informations, même si les moteurs de recherche récupèrent un gros volume de données par jour. Choisir les données structurées reste un meilleur moyen d’utiliser Google pour qu’il puisse affecter les données à la bonne catégorie. Sans l’option structured data, ce moteur de recherche aura du mal à afficher de résultats enrichis.

Les données non structurées

Par opposition aux données structurées, les données non structurées sont des informations stockées ou représentées sous des formats non définis. Elles ont la particularité d’être plus compréhensible par l’humain que par une machine. Difficiles à repérer pour l’outil de balisage Google, la majorité de ces informations apparaissent rarement dans des résultats de recherche. C’est le cas des données sur Wikipédia. Faute de référencement par données structurées, cette page n’arrive pas à structurer ses informations même avec le maximum de requête possible.

L’intérêt des données structurées pour le SEO

Référencement naturel des pages

Contrairement aux idées reçues, les données structurées ou encore le rich snippets peuvent influencer le référencement sur Google. Ces entités modifient le résultat d’apparition de vos pages sur les moteurs de recherche. Prenons l’exemple d’une femme qui veut faire de la mousse au chocolat pour la première fois et va sur Google search. Les données structurées augmentent ses chances d’accéder à des résultats enrichis, car Google trie les pages suivant la note moyenne des avis, leur nombre et le temps de préparation de la mousse.

Les données structurées procurent des informations complémentaires qui sont ajoutées à côté des résultats de recherche. En plus de réduire le taux de rebonds, le structured data vise à générer un maximum de clics, en vous soumettant les informations demandées. Elles vous aident à choisir facilement en vous avançant plus de détails possibles. Suite à une meilleure optimisation SEO, votre chance de tomber sur le bon contenu augmente.

Pour avoir des résultats de recherches de qualité sur Google, servez-vous du rich snippets, car c’est la bonne option. Les algorithmes de recherche Google tentent effectivement de repérer, dans l’ensemble des textes, les entités les plus utilisées. Il s’agit souvent des données suivantes :

  • Des personnes physiques : réelles ou fictives
  • Des personnes morales (organisations) : entreprises, gouvernements, associations, etc.
  • Des lieux
  • Des dates
  • Des noms de produits ou service
  • Quantité
  • Distance
  • Valeur

Les données structurées vous garantissent un résultat de recherche enrichi, mais la longue liste d’entités peut vous induire en erreur. Ci-après les raisons qui causent cette faille dans le référencement des pages :

  • L’emploi des synonymes est vu comme des expressions différentes, mais qui appartiennent à une seule et même entité
  • Contrairement aux homonymes, une même expression peut appartenir à différentes entités
  • La métonymie qui utilise un mot pour signifier une idée distincte, mais qui lui est associée. Ces mêmes données appartiennent à plusieurs entités.

Utilisation d’une extension wordpress

En plus de vos données structurées, vous pouvez aussi utiliser une extension spécifique telle que le référentiel schema.org. Cet outil de balisage désigne une association entre Google, Microsoft, Yahoo et Yandex. Il sert à créer, maintenir et promouvoir des schémas sur les pages web, les messages électroniques, en addition avec les données structurées. En pratique, plusieurs ramifications existent à partir d’une même racine. Si nous recherchons une page de série TV par exemple, les saisons constituent les divisions de cette page. Les embranchements prévoient également de parler d’une personne précise (comme le réalisateur) si vous le souhaitiez. Celle-ci sera aussi considérée comme un autre chemin menant vers la racine principale (la série TV).

Cela n’est qu’une partie de l’impact direct des données structurées sur le référencement naturel, parmi les centaines prévues par schéma.org. L’exploitation des rich snippets par Google ne s’arrête pas à ce stade et l’extension agit comme un outil balisage des données structurées. Il existe aussi d’autres extensions wordpress tels que :

  • Le Schema App Structured Data
  • Et le WP SEO Structured Data Schema

Ces plug-ins prennent compte de tout type de données comme les organisations, les articles, les événements, les produits… Il suffit de sélectionner la catégorie qui vous intéresse et qui correspond à votre page. Le Schema App Structured Data pousse ses recherches plus loin en édifiant vos données structurées à partir des détails existants sur votre site.

Utilisation de l’outil balisage de données

Si votre site ne fonctionne pas sous WordPress, Google a déjà pensé à tout pour que vous ayez la possibilité d’ajouter des données structurées. Les étapes suivantes vous permettent d’y arriver, quelle que soit la nature de votre site :

  • Allez à « l’outil » puis à l’onglet « site web »
  • Choisissez le type de données qui correspond à votre page et copiez-collez l’URL de votre page ainsi que votre code HTML
  • Cliquez sur l’onglet « Commencez le balisage »
  • Vous aurez d’une part et d’autre de l’écran, de gauche à droite, votre page et les alternatives des données structurées possibles
  • Choisissez-en une ou ajoutez-les manuellement
  • Cliquez sur « créer le code HTML »
  • Vous obtiendrez par défaut le code qui correspond aux donnes structurées avec le balisage JSON – LD
  • Copiez-collez ce code à la place du code source
  • Répétez cette action à la page où vous voulez avoir des données structurées

Les types de données structurées

Afin d’avoir une excellente perception des données structurées, il est primordial de comprendre ce qu’est une page web. Cette dernière s’associe à un code HTML (contenu texte, vidéo, audio, image), à des styles CSS (outil permettant au contenu de s’afficher correctement), à des données structurées et à des javas script (moyen de faciliter l’interaction entre internautes). Il existe plusieurs types de structured data, mais les formats de données suivants sont les plus utilisés dans les pages web.

JSON – LD ou JavaScript Object Notation for Linked Data

Il s’agit d’un format de données dérivé du JavaScript servant à lier des données structurées. Son principal rôle est de décrire les entités présentes dans les pages au format JSON, et ce, dans le respect d’un « vocabulaire » défini. L’objectif étant de permettre une facilité de lecture des données par des machines pour chaque catégorie précise. En plus d’une meilleure structuration, l’usage de ce format offre de nombreux avantages tels que :

  • Le regroupement des données au même endroit et la séparation des balises HTML afin de permettre une facilité de génération et de maintenance
  • Son emplacement au niveau de la page : plus dans le « head » que le « body »
  • Souvent inclus dès que la page se charge, mais peut très bien être fait par code JavaScript

RDFa ou Resource Description Framwork

C’est un outil d’indexation des sites web qui emploient les données utilisées pour une présentation plus enrichie des résultats d’analyse. Google et Yahoo sont ses principaux utilisateurs. Les humains s’adaptent mieux à la mise en page avec des majuscules et couleurs et absorbent la signification de la page dans toutes ses formes. Tandis que la machine aurait besoin de balises des données structurées pour comprendre la langue des humains. Cet outil de balisage Google donne l’accès à de meilleures interfaces utilisateurs et réserve une partie des résultats recherche à des publicités pertinentes. Ce format bénéficie de la recommandation du W3C pour faire un ajout de jeu d’attribut aux couches HTML, XHTML et XML et pour cueillir des méta-informations.

Parmi ces jeux d’attribut, on peut citer :

  • About
  • rel ou rev
  • SRC, href et ressource
  • property
  • content
  • datatype
  • et typeof

En utilisant le RDFa, vous serez contraint d’accepter ces règles qui font sa particularité :

  • Les publications sont indépendantes
  • Les données sont réutilisables
  • Les données et les RDFa sont séparés
  • Les schémas retenus sont modulaires
  • Possibilité d’évolution

Microdata

Les micros donnés ou microdata se présentent comme un balisage supplémentaire. Il agit comme un corpus de tags HTML que les moteurs de recherches prennent en considération. De par son usage, les contenus sont plus visibles et attractifs pour les internautes, mais donnent aussi un sens enrichi de la description des pages. Chaque identification (personne, évènement, lieu…) correspond à un vocabulaire spécifique. La liste est très longue, mais voici quelques éléments pour vous donner une idée de cet outil.

  • Itemscope : permet la création d’un item dont le type sera précisé par l’attribut d’après
  • Itemtype : accueille une URL qui pointe la référence du schéma si on l’additionne avec Itemscope
  • Itemprop : apporte une valeur qui précisera la nature d’une donnée sur un ancien schéma spécifié
  • Itemref : sert à faire le lien entre deux données sans descendance

Itemid : utilisable quand l’item a une référence globale unique. Tel est le cas de l’identification d’un livre par son ISBN. L’attribut agit simultanément avec l’attribut itemscope.

Les données structurées permettent de mieux jouir des bénéfices du web sémantique, mais elles ont aussi de limites. L’important reste le partage et la réutilisation des contenus entre plusieurs applications. Tous les utilisateurs peuvent ainsi échanger et associer les données plus facilement sans intermédiaire. Commencez à l’utiliser pour optimiser votre site ainsi que pour baliser et structurer les données. Pour un meilleur référencement de votre page, il convient d’adopter ces trois types de formats.

 

 

 

John

L'expert en référencement naturel de l'équipe, John connait toutes les techniques pour améliorer la visibilité d'un site web.