web-dev-qa-db-fra.com

Les outils pour les webmasters montrent que les anciennes URL sont explorées

Nous avons renouvelé notre site web l'année dernière (2012) en décembre. Après cela, nous avons mis en place la redirection 301 pour les pages requises. Nous avons supprimé certaines pages de l'ancien site lorsque nous avons migré vers un nouveau site.

Par exemple: Dans l'ancien site, nous avions http://www.mydomain.com/article/ et dans le nouveau site Web, nous l'avons supprimé.

Les pages qui n'existent pas dans le nouveau site, nous le redirigeons vers la page 404. Depuis lors, le rapport Webmaster -> Crawler Errors -> Not Found affiche ces anciennes URL avec un code de réponse de 404. Le symbole La section Lié à partir de affiche les liens de sites internes qui font référence à cette page. Lorsque j'ai vérifié ces pages, le lien n'a pas été trouvé.

Je comprends en lisant ce lien Google http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=2409439 que cette erreur ne nuit pas à notre référencement, mais je voudrais tiens à savoir la raison exacte pour laquelle cela se produit.

4
FR STAR

Lorsque Googlebot explore une URL et y récupère un document, il ne l'oubliera jamais. Un site sur lequel j'ai travaillé a changé sa structure d'URL il y a plus de 10 ans. Ils ont mis en place 301 redirections pour rediriger chaque URL vers une URL conviviale pour le référencement. À ce jour, Googlebot explorera occasionnellement toutes les anciennes URL, juste pour vérifier.

Si vous ne voulez pas que ces URL apparaissent dans le rapport 404, vous pouvez faire deux choses.

  • Transférez-les vers une autre page associée avec 301 redirections. Notez que vous ne pouvez pas les rediriger vers la page d'accueil ou vers une page 404, sinon Google les considère toujours comme 404.
  • Utilisez le statut HTTP "410 Gone" qui indique à Google que vous les avez supprimés volontairement. Google traite "410 Gone" de manière très similaire à "404 Introuvable", mais il analyse moins fréquemment les URL "obsolètes" et ne devrait pas les mettre dans le rapport 404.

Google conserve la trace des liens vers les pages. Vous voyez ceci dans le rapport de page qui renvoie aux 404 pages. Cela ressemble plus à une liste de pages qui ont actuellement un lien vers o ont été liées à la page. Google dit: "Nous explorons cette page car nous avons trouvé un lien vers celle-ci à un moment donné." Encore une fois, googlebot ne semble pas oublier, même lorsque les liens ont disparu.

4