web-dev-qa-db-fra.com

Différence entre le nombre d'URL du plan du site et le nombre d'URL de la console de recherche

Mon sitemap contient 4 000 URL, mais la console de recherche Google affiche 9603 pages Web envoyées. Pourquoi? Devrais-je m'en préoccuper?

1
user94374

Combien de pages/URL uniques devriez-vous avoir?

Votre sitemap (XML) est uniquement consultatif. Il informe les moteurs de recherche sur les URL que vous souhaitez indexer, mais n'empêche pas les autres URL découvertes d'être indexées. Il peut être utile d’avoir un sitemap couvrant seulement un sous-ensemble de pages, afin de savoir combien de pages du sous-ensemble sont indexées.

Si votre sitemap contient toutes vos URL canoniques et que Google a indexé plus de deux fois ce nombre, il se peut qu'un ou plusieurs des événements suivants se produisent.

  • Vous avez beaucoup plus de pages sur votre site que vous ne le pensiez (qui ne figurent pas dans votre sitemap). Peut-être des pages que vous ne voulez pas indexer, mais vous n'avez rien fait pour empêcher ces autres pages d'être indexées.

Et/ou

  • Vous avez potentiellement un problème de contenu en double et Google trouve le même contenu sous plusieurs URL? par exemple. /foo/bar et /foo/bar?sortby=name sont des URL différentes. Cela peut souvent être résolu avec les balises méta rel="canonical".

Et/ou

  • Google indexe vos pages de résultats de recherche internes. Ceci n'est pas souhaitable. Google devrait peut-être pouvoir analyser vos résultats de recherche, mais pas les indexer.

Et/ou

  • Votre site est "sous attaque" et un tiers malveillant crée de nombreux liens absurdes vers votre site dans le but de diluer votre référencement.

Dans les deux cas, vous devez déterminer la nature de ces URL "supplémentaires" indexées.

1
DocRoot

Par pages envoyées, je suppose que vous voulez dire des pages indexées.

Tout d'abord, afin de comprendre ce qu'est le plan du site, jetez un œil à réponse de John's Muller dans un autre article de la pile où il explique plus en détail.

Un sitemap court aide uniquement Google à récupérer des URL plus rapides dans la page de résultats de recherche et aide Google à rechercher les URL là où il ne pouvait normalement pas (non lié ou problème d'analyse de l'URL).

En fonction de la manière dont votre sitemap est généré, vous devez suivre certaines règles:

  • Seulement 200 pages de codes d'état
  • Avoir la version canonique de la page
  • Répertoriez uniquement les pages que vous souhaitez inclure dans l'index.

Si vous avez plus de pages dans l'index Google que dans le sitemap, cela peut être dû à plusieurs raisons:

  • Pages dupliquées
  • Pages filtrées
  • Navigation à facettes

Pour vous débarrasser des pages inutiles d’index, vous devez effectuer un audit technique rapide et voir si les pages filtrées sont correctement canonisées ou si elles n’ont pas de directive noindex.

1
John Could