La valeur par défaut robots.txt de Blogspot est:
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Allow: /
Sitemap: http://castbird-sourcing.blogspot.com/feeds/posts/default?orderby=UPDATED
Mais quand je site: castbird-sourcing.blogspot.com la recherche sur Google montre quelque chose comme:
In order to show you the most relevant results, we have omitted some entries very similar to the 32 already displayed.
If you like, you can repeat the search with the omitted results included.
Lorsque je développe le résultat, je vois quelque chose comme:
castbird-sourcing.blogspot.com/search/label/gadget
A description for this result is not available because of this site's robots.txt – learn more.
Mes questions sont:
/search
? Pourquoi Google indexe-t-il toujours ces pages?/search
du résultat Google?est-ce que ce très similaire au problème 32 déjà affiché nuit au référencement en général?
Google détermine la page à afficher parmi celles présentant un contenu similaire en fonction de la requête de l'utilisateur et d'autres algorithmes. Par exemple, si un utilisateur recherche des gadgets et que vous avez une page d'étiquette pour les gadgets, le résultat sera plus approprié que des pages de publication spécifiques de votre blog.
Voir this page.
Matt Cutts a répété à deux reprises qu'il ne fallait pas insister là-dessus. Dans le pire des cas, Google pourrait simplement ignorer le contenu dupliqué. Matt a déclaré dans la vidéo: "Je ne voudrais pas insister sur ce sujet à moins que le contenu que vous avez dupliqué soit du spam ou du mot-clé bourré."
.
googlebot n'aurait-il pas déjà tout ignoré/recherche? Pourquoi Google indexe-t-il toujours ces pages?
Voir this page.
Bien que Google n'analyse pas et n'indexe pas le contenu des pages bloquées par le fichier robots.txt, il est possible que les URL soient indexées si nous les trouvons sur d'autres pages du Web. Par conséquent, l'URL de la page et, éventuellement, d'autres informations accessibles au public, telles que le texte d'ancrage dans les liens vers le site ou le titre du projet Open Directory (www.dmoz.org), peuvent apparaître dans les résultats de recherche Google.
.
Comment puis-je supprimer complètement le lien indexé/recherche du résultat Google?
Je ne sais pas si cela fonctionne mais vous pouvez essayer la méthode ici . Cependant, je suggérerais que vous laissiez les pages telles quelles et elles ne causeraient aucun dommage à votre référencement. De nombreux blogs Blogger fonctionnent bien dans les SERP, même si Google a ajouté des pages de recherche d'étiquettes à sa base de données.