Nous avons renouvelé notre site web l'année dernière (2012) en décembre. Après cela, nous avons mis en place la redirection 301 pour les pages requises. Nous avons supprimé certaines pages de l'ancien site lorsque nous avons migré vers un nouveau site.
Par exemple: Dans l'ancien site, nous avions http://www.mydomain.com/article/
et dans le nouveau site Web, nous l'avons supprimé.
Les pages qui n'existent pas dans le nouveau site, nous le redirigeons vers la page 404. Depuis lors, le rapport Webmaster -> Crawler Errors -> Not Found
affiche ces anciennes URL avec un code de réponse de 404. Le symbole La section Lié à partir de affiche les liens de sites internes qui font référence à cette page. Lorsque j'ai vérifié ces pages, le lien n'a pas été trouvé.
Je comprends en lisant ce lien Google http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=2409439 que cette erreur ne nuit pas à notre référencement, mais je voudrais tiens à savoir la raison exacte pour laquelle cela se produit.
Lorsque Googlebot explore une URL et y récupère un document, il ne l'oubliera jamais. Un site sur lequel j'ai travaillé a changé sa structure d'URL il y a plus de 10 ans. Ils ont mis en place 301 redirections pour rediriger chaque URL vers une URL conviviale pour le référencement. À ce jour, Googlebot explorera occasionnellement toutes les anciennes URL, juste pour vérifier.
Si vous ne voulez pas que ces URL apparaissent dans le rapport 404, vous pouvez faire deux choses.
Google conserve la trace des liens vers les pages. Vous voyez ceci dans le rapport de page qui renvoie aux 404 pages. Cela ressemble plus à une liste de pages qui ont actuellement un lien vers o ont été liées à la page. Google dit: "Nous explorons cette page car nous avons trouvé un lien vers celle-ci à un moment donné." Encore une fois, googlebot ne semble pas oublier, même lorsque les liens ont disparu.