J'ai supprimé quelques milliers de pages d'un site Web. Ils n'apparaissent pas dans mon sitemap.xml et aucune autre page du Web ne pointe plus vers ceux-ci.
Les erreurs d'analyse pages de Google Webmaster Tools (GWT) commencent à indiquer qu'ils ne sont pas trouvés. Il existe une option pour les marquer comme fixes. Dois-je les marquer comme fixes? Ils ne sont pas vraiment réparés et ne le seront jamais.
Il y a aussi une page remove URLs, mais je ne peux pas supprimer manuellement ces pages une à une (REM: ces pages ne sont pas dans un seul répertoire, elles étaient partout, alors est non robots.txt directive que je pourrais utiliser).
Si Google ne trouve pas une page, la supprime-t-elle automatiquement de son index, ou si nous la marquons comme étant fixe, tente-t-elle de la rejoindre encore et encore?
Que vous les marquiez ou non comme fixés, cela n'aura aucune incidence sur les performances de votre site. L'idée de cette fonctionnalité est simplement de permettre aux webmasters de nettoyer leur rapport lorsqu'ils ont des erreurs corrigées. Google finira par avoir l’idée qu’une page ne reviendra pas, mais cela peut prendre un certain temps.
On peut soutenir que si ces pages ont disparu pour toujours, elles doivent renvoyer un code HTTP 410. Apparemment, il n'y a pas beaucoup de différence dans la manière dont Google traite les 410 et les 404, mais John Mueller de Google a suggéré que les 410 peuvent être nettoyés plus rapidement.
Autrement, selon ce que vous avez supprimé et pourquoi, il peut exister un argument de bonne expérience utilisateur permettant de rediriger 301 vers un équivalent proche (par exemple, une page de destination de catégorie parente). Cela peut aussi avoir des avantages en termes de référencement.
Google met régulièrement à jour l'intégralité de son index. Lorsque nous explorons le Web, ils trouvent automatiquement les nouvelles pages, suppriment les liens obsolètes et reflètent les mises à jour des pages existantes, tout en gardant l’index de Google à jour et aussi à jour que possible.
Si des pages obsolètes de votre site apparaissent dans les résultats de la recherche, assurez-vous qu’elles renvoient l’état 404 (introuvable) ou 410 (disparu) dans l’en-tête. Ces codes d'état informent Googlebot que l'URL demandée n'est pas valide. Certains serveurs sont mal configurés pour renvoyer l'état 200 (Réussite) pour les pages inexistantes, ce qui indique à Googlebot que les URL demandées sont valides et doivent être indexées. Si une page renvoie une véritable erreur 404 via les en-têtes http, toute personne peut la supprimer de l'index Google à l'aide de l'outil de demande de suppression de page Web. Les pages obsolètes qui ne renvoient pas d'erreurs 404 vraies tombent généralement de notre index naturellement lorsque d'autres pages cessent de s'y lier.