Google Webmaster Tools signale une erreur d'analyse "404 (Introuvable)" pour une page .html qui n'a jamais existé sur un site Web que j'ai développé. La page rapportée est "tyuiabmog.html", qui ne semble pas avoir été nommée par un humain!
Quelqu'un peut-il m'aider, s'il vous plaît, à m'aider à mieux comprendre comment Google a découvert cette page inexistante et pourquoi il tente de l'explorer?
Je pense que Google et les autres moteurs de recherche le font pour découvrir le comportement par défaut de votre site Web. Ils visitent une page nommée de manière aléatoire en particulier parce qu'elle n'existe pas, afin de pouvoir différencier une page 404 d'une page normale devant être indexée. Cela les aide à analyser correctement les serveurs qui ne renvoient pas de code d'état 404, par exemple.
Lorsqu'une page est signalée dans WMT, cela signifie que son bot a effectivement essayé de scanner cette page normalement. En cliquant sur l'erreur, vous pouvez voir où la page est liée. Il peut y avoir des liens non valides vers votre site Web sur le Web. Vous devez le rechercher et éventuellement en informer les propriétaires de ces sites, le cas échéant.
Apparemment, la réponse sélectionnée fait référence à la façon dont les bots essaient de trouver vos 404, mais ce n’est pas ce que la question semble être.
Il est possible qu'une page (sur votre site ou à l'extérieur) soit liée à ce fichier sur votre domaine. Parce que ce fichier n'existe pas, vous obtenez une erreur 404.
J'ai déjà vu ce genre d'erreur apparaître dans une balise rel canonical défectueuse.
Recherchez l'erreur 404 dans les Outils pour les webmasters et accédez à Lié de. Extrayez l'URL liée à et affichez la source sur cette page. Assurez-vous de rechercher le lien d'erreur 404 dans la source - il est peut-être masqué, mais il devrait l'être.
Nous avons également trouvé une page 404 liée à une page 404 dans les outils pour les webmasters de Google. Je ne sais pas quoi faire avec ça.
<a href="helloworld.pdf" onClick="_gaq.Push(['_trackPageview','/download-helloworld']);">Hello World PDF</a>
Lorsque Googlebot le voit, cela peut tenter d'explorer
https://www.example.com/download-helloworld/
et quand aucun contenu n'est trouvé, vous obtenez un lien avec une erreur 404 dans votre compte de webmasters qui n'a jamais existé voir ceci