J'ai un site avec plusieurs pages (30MM + indexées) et je reçois depuis longtemps un message d'avertissement extremely high number of URLs on your site
. Je songe à réduire le nombre d'URL que Google voit en particulier entre des pages similaires, en particulier sur les pages qui ont un modèle de langue différent mais le même contenu.
Actuel pour chaque page que j'ai dans mon <head>
:
<link rel="alternate" hreflang="en x-default" href="http://mydomain.com/dir/page" />
<link rel="alternate" hreflang="ja" href="http://ja.mydomain.com/dir/page" />
<link rel="alternate" hreflang="ko" href="http://ko.mydomain.com/dir/page" />
<link rel="alternate" hreflang="th" href="http://th.mydomain.com/dir/page" />
<link rel="alternate" hreflang="es" href="http://es.mydomain.com/dir/page" />
<link rel="alternate" hreflang="pt" href="http://pt.mydomain.com/dir/page" />
L'ajout d'un rel=nofollow
ou d'un fichier robots.txt interdira-t-il à Google de se concentrer sur les pages les plus importantes à explorer plutôt que d'explorer un autre modèle de la même page?
L'ajout de nofollow n'empêche généralement pas Googlebot de découvrir du contenu. Voir: n attribut "nofollow" sur un lien empêche-t-il la découverte des URL par les moteurs de recherche?
Si le lien nofollow est le seul lien vers cette page, Google ne l'indexera pas. Dans votre cas, je doute fort que vos liens de langue alternative soient les seuls liens vers vos autres sites. Une fois que Google a trouvé un lien dofollow vers une page quelconque du sous-domaine d’une autre langue, ils seraient en mesure de découvrir le reste avec des liens dofollow.
L'avertissement "nombre extrêmement élevé d'URL sur votre site" des outils pour les webmasters ne vous inquiète pas si votre site est supposé comporter autant de pages. Google est plus préoccupé par des cas tels que:
Chaque site contenant des millions de pages reçoit ce message dans les Outils pour les webmasters. Un site comportant autant de pages ne pose pas de problème s'il possède le contenu pour le sauvegarder. J'ai moi-même travaillé avec plusieurs de ces sites. Aucun d'entre eux n'a eu de problèmes avec les classements à cause de cela.