Quel « sitemap » ou « plan de site » Google recommande-t-il d’utiliser ?

quel-sitemap-google-recommande-xml-ou-html

C’est d’abord une question de syntaxe… historiquement lorsque les référenceurs parlent de “plan de site” ou “sitemap” rien n’est réellement clair ! En effet, il existe deux types : le plan de site HTML et le plan de site XML (on parlera également de Sitemap HTML et Sitemap XML). Pour simplifier encore plus le sujet, Google a changé sa façon de communiquer au travers de ses recommandations. Désormais, Google fait référence à des “page de navigation simple” et des sitemaps.

Donc pour Google :

  • “Page de navigation simple” = “plan de site HTML” = “sitemap HTML”
  • “sitemap” = “plan de site XML” = “sitemap XML”

Reste l’épineuse question du rôle de ces 2 options pour signaler les pages. Google n’est malheureusement pas clair et laisse un espace important aux interprétations…

Voici les communications existantes à date (source : https://developers.google.com/search/docs/crawling-indexing/sitemaps/overview?hl=fr )

Ai-je besoin d’un sitemap ?

Si les pages de votre site sont correctement liées entre elles, Google est généralement en mesure de découvrir la majeure partie de votre site. Une utilisation appropriée des liens permet de s’assurer que toutes les pages que vous jugez importantes peuvent être consultées par le biais d’une méthode de navigation quelconque, qu’il s’agisse du menu de votre site ou les liens que vous avez insérés sur les pages. Néanmoins, l’envoi d’un sitemap contribue à améliorer l’exploration des sites vastes ou complexes, ainsi que des fichiers très spécialisés.

→ ici, le Sitemap (XML) n’est pas une obligation si le maillage du site est bien réalisé.

Néanmois, Google apporte des précisions sur ce support, et c’est subtil :  https://developers.google.com/search/docs/fundamentals/seo-starter-guide?hl=fr#createsimplenavpage 

Créer une page de navigation pour les internautes et un sitemap pour les moteurs de recherche

Incluez une page de navigation simple pour l’ensemble de votre site (ou les pages les plus importantes, si vous en avez des centaines ou des milliers) pour les internautes. Créez un fichier sitemap XML pour garantir que les moteurs de recherche découvrent les pages ajoutées et mises à jour sur votre site, en répertoriant toutes les URL pertinentes ainsi que les dates de dernière modification de leur contenu principal.

Ici, l’élément de plus important à retenir est le “et” dans “Créer une page de navigation pour les internautes et un sitemap pour les moteurs de recherche

Google indique ici plus clairement qu’il faut des liens listés dans un “plan de site HTML” (= »page de navigation simple » = dans de vraies pages) et également un fichier sitemap XML pour découvrir les nouvelles pages.

→ donc, ici, il faut clairement les 2 types : HTML et XML.

Néanmoins, ailleurs Google précise : 

L’utilisation d’un sitemap n’est pas indispensable dans les cas suivants :
[…]
Votre site propose des liens pour l’ensemble de ses pages. Autrement dit, Google n’aura qu’à suivre les liens depuis la page d’accueil pour identifier toutes les pages importantes.

→ donc, un plan de site HTML qui liste toutes les URLs que l’on souhaite indexer est suffisant.

Par contre, Google indique sur le même support (et c’est très intéressant) que si le site comporte de nombreux contenus de type Vidéo, Image ou actualité :  “Le cas échéant, nous pouvons prendre en compte dans notre recherche d’autres informations qui proviennent des sitemaps”.

A quoi sert réellement un plan de site XML / sitemap XML ? Quelles sont les informations que Google considère.

Il est ici intéressant de constater que les recommandations de Google peuvent se télescoper…

Google indique en introduction du sujet ( https://developers.google.com/search/docs/crawling-indexing/sitemaps/overview?hl=fr  )

Un sitemap indique à Google les fichiers que vous jugez importants sur votre site et fournit également des informations précieuses sur ces fichiers. Par exemple, il permet d’indiquer la dernière date de mise à jour d’une page, sa fréquence de modification et les versions qui existent dans d’autres langues.

On voit toute la confusion possible pour une personne qui resterait sur cette seule lecture, il serait alors important de renseigner une valeur <changefreq> dans le fichier XML

Mais dans une autre partie des recommandations, Google précise ( https://developers.google.com/search/docs/crawling-indexing/sitemaps/build-sitemap?hl=fr )

Google ignore les valeurs <priority> et <changefreq>”

Néanmoins, et c’est le plus important, Google indique sur la même source que l’information la plus importante reste la date de modification <lastmod> :

Google utilise la valeur <lastmod> si elle est cohérente et vérifiable (par exemple, en comparant la dernière modification de la page).

Au regard de cette dernière information, un soin tout particulier doit être apporté à la cohérence entre les dates de modifications renseignées dans le fichier XML et réellement observées dans le crawl des pages (valeur de l’entête HTTP « last-modification »).

 

En conclusion :

  • s’il devait n’y avoir qu’un seul type de “plan de site” à créer (par exemple pour des limitations techniques ou budgétaires), il est clair que le plan de site HTML = “page de navigation simple” est la seule option. Si cette option est retenue, le référenceur devra être transparent sur le fait que toutes les pages son bien maillées par des liens et que les modifications réalisées sur le contenu ne pourront être communiquées à Google (pas de fichier XML).
  • un référenceur doit proposer à la fois la création d’un plan de site HTML (pour le maillage le plus complet possible des pages importantes) et la mise en place d’un Sitemap XML pour signaler les modification apportées aux pages du site (et accessoirement apporter des précisions sur les médias et types de contenus).

 

Rédigé par Florian Bessonnat, le 12/02/2023