Google Webmaster Tools a signalé une erreur d'analyse 404 (Introuvable) pour une page qui n'a jamais existé

Question

Google Webmaster Tools signale une erreur d'analyse "404 (Introuvable)" pour une page .html qui n'a jamais existé sur un site Web que j'ai développé. La page rapportée est "tyuiabmog.html", qui ne semble pas avoir été nommée par un humain!

Quelqu'un peut-il m'aider, s'il vous plaît, à m'aider à mieux comprendre comment Google a découvert cette page inexistante et pourquoi il tente de l'explorer?

Jacob Hume · Accepted Answer

Je pense que Google et les autres moteurs de recherche le font pour découvrir le comportement par défaut de votre site Web. Ils visitent une page nommée de manière aléatoire en particulier parce qu'elle n'existe pas, afin de pouvoir différencier une page 404 d'une page normale devant être indexée. Cela les aide à analyser correctement les serveurs qui ne renvoient pas de code d'état 404, par exemple.

Collector · Answer

Lorsqu'une page est signalée dans WMT, cela signifie que son bot a effectivement essayé de scanner cette page normalement. En cliquant sur l'erreur, vous pouvez voir où la page est liée. Il peut y avoir des liens non valides vers votre site Web sur le Web. Vous devez le rechercher et éventuellement en informer les propriétaires de ces sites, le cas échéant.

Apparemment, la réponse sélectionnée fait référence à la façon dont les bots essaient de trouver vos 404, mais ce n’est pas ce que la question semble être.

Sinan · Answer

Il est possible qu'une page (sur votre site ou à l'extérieur) soit liée à ce fichier sur votre domaine. Parce que ce fichier n'existe pas, vous obtenez une erreur 404.

Cynthia Coffield · Answer

J'ai déjà vu ce genre d'erreur apparaître dans une balise rel canonical défectueuse.

Recherchez l'erreur 404 dans les Outils pour les webmasters et accédez à Lié de. Extrayez l'URL liée à et affichez la source sur cette page. Assurez-vous de rechercher le lien d'erreur 404 dans la source - il est peut-être masqué, mais il devrait l'être.

Nous avons également trouvé une page 404 liée à une page 404 dans les outils pour les webmasters de Google. Je ne sais pas quoi faire avec ça.

cedverd · Answer

Ces erreurs se produisent lorsqu'une personne navigue vers une URL inexistante sur votre site. Peut-être que quelqu'un a mal saisi une URL dans le navigateur ou quelqu'un une erreur de frappe d'une URL de lien.
Googlebot peut générer ces URL inattendues en essayant de suivre les liens présents dans JavaScript, les fichiers Flash ou tout autre contenu intégré.
votre site peut utiliser un code comme celui-ci

<a href="helloworld.pdf" onClick="_gaq.Push(['_trackPageview','/download-helloworld']);">Hello World PDF</a>

Lorsque Googlebot le voit, cela peut tenter d'explorer

https://www.example.com/download-helloworld/

et quand aucun contenu n'est trouvé, vous obtenez un lien avec une erreur 404 dans votre compte de webmasters qui n'a jamais existé voir ceci