Mon sitemap contient 4 000 URL, mais la console de recherche Google affiche 9603 pages Web envoyées. Pourquoi? Devrais-je m'en préoccuper?
Combien de pages/URL uniques devriez-vous avoir?
Votre sitemap (XML) est uniquement consultatif. Il informe les moteurs de recherche sur les URL que vous souhaitez indexer, mais n'empêche pas les autres URL découvertes d'être indexées. Il peut être utile d’avoir un sitemap couvrant seulement un sous-ensemble de pages, afin de savoir combien de pages du sous-ensemble sont indexées.
Si votre sitemap contient toutes vos URL canoniques et que Google a indexé plus de deux fois ce nombre, il se peut qu'un ou plusieurs des événements suivants se produisent.
Et/ou
/foo/bar
et /foo/bar?sortby=name
sont des URL différentes. Cela peut souvent être résolu avec les balises méta rel="canonical"
.Et/ou
Et/ou
Dans les deux cas, vous devez déterminer la nature de ces URL "supplémentaires" indexées.
Par pages envoyées, je suppose que vous voulez dire des pages indexées.
Tout d'abord, afin de comprendre ce qu'est le plan du site, jetez un œil à réponse de John's Muller dans un autre article de la pile où il explique plus en détail.
Un sitemap court aide uniquement Google à récupérer des URL plus rapides dans la page de résultats de recherche et aide Google à rechercher les URL là où il ne pouvait normalement pas (non lié ou problème d'analyse de l'URL).
En fonction de la manière dont votre sitemap est généré, vous devez suivre certaines règles:
Si vous avez plus de pages dans l'index Google que dans le sitemap, cela peut être dû à plusieurs raisons:
Pour vous débarrasser des pages inutiles d’index, vous devez effectuer un audit technique rapide et voir si les pages filtrées sont correctement canonisées ou si elles n’ont pas de directive noindex.