Lorsque j'ai vérifié les pages d'index de mon site Web, seules 252 pages ont été indexées, mais lorsque j'ai effectué une recherche via Google Search en tapant site:http://www.example.com
, il indique que plus de 900 pages sont indexées.
Quel est ce problème et même sur les outils pour les webmasters, j’ai soumis un sitemap XML et un nombre de pages soumis supérieur à 900, mais pourquoi l’index affiche-t-il une valeur faible?
Les URL indexées correspondent-elles exactement à celles de votre sitemap? Si tel est le cas, ils doivent être comptés dans ceux "indexés".
Si vous avez des centaines de différences, essayez de comparer les URL à celles de votre sitemap. Il se peut que Google indexe des URL différentes de celles que vous avez envoyées, par exemple une version incorrecte du site Web ou des URL non pertinentes que vous ne souhaitiez pas indexer, comme les pages de recherche ou de calendrier.
Cela a à voir avec une combinaison de choses. Votre sitemap ne dit pas vraiment à Google quoi indexer. C'est plus un guide pour les araignées qu'autre chose. En fait, si vous n'aviez pas de plan du site mais que vous aviez soumis votre site Web à Google, celui-ci serait tout de même analysé.
Le problème avec avoir le site: domain.com vous en montre tellement, c'est parce que, pour les robots de recherche, tout ce qui peut potentiellement être ouvert avec une URL est une page. Ceci est le plus fréquent avec les sites WordPress. Par exemple, si vous avez un WordPress woocomerce, techniquement, chaque produit peut être ouvert dans sa propre page. Cela ressemblerait à ceci:
www.example.com/category1/products/product1/variation1
Donc, si vous aviez 40 produits divisés en 5 catégories et que chaque produit a 3 variations de couleurs ou de tailles. Vous aurez 125 pages qui ne sont pas vraiment dans la structure de votre site ou même dans votre sitemap. 120 d'entre elles peuvent vous être utiles, mais les pages de 5 catégories sont inutiles.
faire des travaux dans votre fichier robot.txt. notez sur votre site: domain.com et refusez les 404 et les pages qui ne vous fournissent aucune valeur de référencement. (par exemple, termes et conditions, politique de confidentialité, pages de catégorie, pages de balises, une image qui apparaît dans sa propre page lorsque vous cliquez dessus, etc.)
Vous ne pouvez pas faire confiance au nombre de résultats que vous obtenez lorsque vous effectuez une recherche site:
. Les chiffres de Google Webmaster Tools seront beaucoup plus précis.
Tout d’abord, le nombre de résultats renvoyés par Google pour toute recherche (et pas seulement pour les recherches sur site) est souvent incroyablement innacurate . L'article lié explique en détail les raisons de cette situation et inclut la citation suivante de Matt Cutts, de Google:
Nous essayons de préciser que nos estimations de résultats ne sont que des estimations. En théorie, nous pourrions passer des cycles sur cet aspect de notre système, mais en pratique, nous avons beaucoup de choses à travailler, et des estimations de résultats plus précises sont plus basses sur la liste que de nombreuses autres choses.
Pour les recherches site:
, Google tente volontairement de rendre les résultats un peu moins informatifs. Ceci est fait pour empêcher les gens de laisser trop de connaissances sur Google et les sites Web qu'ils indexent en effectuant des recherches spécialement conçues. Dans ce cas, Google a décidé d'afficher le nombre de pages indexées sur votre site uniquement à vous, le webmaster, via sa console de webmaster authentifiée. Ils montrent exprès un nombre inexact au public. Ils croient que le nombre de documents indexés sur votre site est destiné à votre connaissance et à celle de Google, mais cela devrait être votre secret.