J'ai exporté une liste de pages 404 et 403 à partir de la console de recherche Google. J'ai comparé ces URL à l'analyse de mon site. Les 404 pages de la console de recherche Google ne figurent pas dans la liste de pages d'analyse de mon site.
Cela signifie-t-il que je n'ai pas besoin de rediriger 301 ces pages qui ont été récupérées par GSC?
Ces pages proviennent probablement de liens externes brisés. Google les explore, reçoit un 404 mais les revisit parfois au cas où ils auraient été corrigés.
Si vous souhaitez préserver les avantages en termes de trafic/backlink de ces liens, vous devez toujours les rediriger.
Si vous cliquez sur l'URL dans le rapport Erreurs d'exploration, vous obtiendrez une fenêtre contextuelle contenant un onglet "Lié de". Dans cet onglet, Google vous indiquera où il a trouvé le lien vers ces pages:
Vous pouvez trouver qu'ils sont:
Votre propre analyse de site est seulement susceptible de trouver les liens brisés sur votre propre site. Étant donné que Googlebot explore tout le Web et dispose d'heuristiques pour trouver ce qu'il pense être des liens, il détectera plus d'erreurs que votre propre analyse, celle de votre site uniquement.
Je ne corrigerais une erreur 404 que si cela concerne aussi bien les utilisateurs que Googlebot. Les liens brisés de votre site valent toujours la peine d'être réparés. Les liens brisés de sites tiers méritent d’être corrigés si vous pouvez dire à quoi ils sont censés pointer. La stupidité de Googlebot de choisir des éléments qui pourraient être des liens en JavaScript n’est que du bruit.
Google s'attend à ce que les sites fonctionnant correctement comportent environ 404 erreurs. En fait, Google s'inquiète si Googlebot n'obtient jamais d'erreur 404 pour une URL, en particulier pour celles qui devraient être indésirables. Tant que les URL qui renvoient un 404 ne sont pas supposées avoir du contenu, ces erreurs 404 ne feront aucun mal à votre site. Peu importe qu'il y en ait 10 ou 10 millions.
Il existe quelques méthodes de base pour corriger les erreurs d'analyse:
/page.ht
-> /page.html
)