Sitemap

Référencement naturel SEO

Un Sitemap (ou plan de site) est un fichier — XML la plupart du temps, parfois HTML — qui liste de façon structurée l’ensemble (ou une partie stratégique) des URL d’un site web. Destiné d’abord aux moteurs de recherche, il sert de carte d’orientation : il indique quelles pages explorer, leur fréquence de mise à jour, leur date de dernière modification et, facultativement, leur importance relative. Pour l’utilisateur humain, une version HTML peut également faciliter la découverte du contenu. Véritable GPS des robots d’indexation, le sitemap optimise le crawl, accélère l’indexation et réduit les risques d’oublis, surtout sur les sites volumineux ou dynamiques.‍‍

Les éléments clés d’un sitemap efficace‍

  • Format XML valide : respect du protocole Sitemaps.org (<urlset>, <url>, <loc>, <lastmod>, <changefreq>, <priority>) et encodage UTF-8.
  • URL canoniques uniquement : inclusion de la version finale (HTTPS, www ou non-www) pour éviter la duplication.
  • Segmentation pertinente : plusieurs fichiers (ex. /sitemap‐articles.xml, /sitemap‐produits.xml) lorsque le site dépasse 50 000 URL ou 50 Mo non compressé.
  • Mise à jour automatique : génération via CMS ou script CI/CD pour refléter les nouvelles pages et suppressions sans délai.
  • lastmod et changefreq renseignés : indications de fraîcheur qui aident Google à prioriser son crawl budget.
  • Compression et ping : fichier .gz pour gagner de la bande passante ; ping automatique de Google et Bing après chaque mise à jour.
  • Index de sitemaps : fichier maître (<sitemapindex>) listant les sous-sitemaps afin de simplifier la déclaration dans la Search Console.
  • Version HTML facultative : plan de site visible pour les utilisateurs, améliorant l’UX et la distribution de liens internes.‍‍

Pourquoi soigner son sitemap ?‍

  • Accélérer l’indexation : les nouvelles pages sont découvertes plus rapidement, surtout si elles sont faiblement liées.
  • Optimiser le crawl budget : Googlebot se concentre sur les URL importantes au lieu de perdre du temps sur des pages sans valeur.
  • Faciliter le SEO international : sitemaps spécifiques par langue ou par zone géographique combinés aux balises hreflang.
  • Suivre la couverture d’indexation : Search Console fournit des rapports d’erreurs (404, 500, exclusions) basés sur le sitemap.
  • Réduire les risques d’erreurs humaines : génération automatisée évite les oublis lors de la création ou la suppression de pages.
  • Améliorer la transparence : un sitemap propre signale aux moteurs un site bien entretenu, potentiellement valorisé dans les SERP.‍‍

Petite anecdote sitemap

En 2018, The Guardian a découvert que plus de 12 000 billets d’archives (antérieurs à 2003) ne recevaient aucun trafic organique : Google les ignorait, faute de liens internes récents. Plutôt que de modifier des milliers d’articles, l’équipe a simplement généré un sitemap dédié “archives”, compressé et soumis dans la Search Console. En moins d’un mois, près de 85 % de ces pages ont été réindexées, certaines ressurgissant en une sur des requêtes historiques. Preuve qu’un simple fichier XML peut redonner voix à des années de journalisme… et offrir aux robots une machine à remonter le temps !

Découvrir les prestations SEO

Update cookies preferences