Je continue à avoir cette erreur 404 page non trouvée sur mon compte Google Webmaster. J'utilise un site Web WordPress. J'ai vérifié chaque lien brisé mais je n'ai pas trouvé d'où venaient ces liens.
Voici quelques erreurs. J'ai plus de 2000 erreurs similaires:
Tous ces liens montrent une erreur de page introuvable. Il y en a beaucoup plus pour presque tous mes articles et pages. Qu'est-ce qui a amené Google à ajouter "/ 2370/2345 /" à mes URL?
Google utilise des heuristiques pour trouver des "liens". Ceux-ci peuvent ne pas provenir de liens brisés du tout. Google analyse le code source de vos sites pour rechercher tout ce qui "ressemble" à une URL.
Vous pourriez avoir du JavaScript dans la page comme:
var s = "2370/2317"
Ou un attribut de données comme:
<div data-counts="2370/2317">
En raison de la barre oblique, Googlebot penserait que cela ressemble à une URL relative. Il essaiera ensuite de le suivre et d’obtenir les erreurs 404.
Malgré le fait que c’était une heuristique (et non un lien cassé) qui a amené Googlebot à trouver le 404, Google signalera ces erreurs 404 dans Google Webmaster Tools.
La bonne nouvelle est que cela ne nuit pas du tout à votre site. Le seul inconvénient est que cela encombre ce rapport et vous empêche de trouver de vrais problèmes 404.
Vous pouvez atténuer cela en ajustant votre source de page afin que cette chaîne de nombres n'apparaisse pas. Par exemple, rompre une chaîne JavaScript pourrait empêcher Googlebot de la récupérer:
var s = "2370" + "/" + "2317";
Voici ce que John Mueller de Google (qui travaille sur les outils pour les webmasters et les sitemaps) doit dire environ 404 erreurs qui apparaissent dans les outils pour les webmasters :
HELP! MON SITE A 939 ERREURS DE CRAWL !! 1
Je vois ce genre de question plusieurs fois par semaine; vous n'êtes pas seul - de nombreux sites Web contiennent des erreurs d'analyse.
- Les erreurs 404 sur des URL non valides ne nuisent en aucune façon à l’indexation ou au classement de votre site . Peu importe qu’il y en ait 100 ou 10 millions, ils ne nuisent pas au classement de votre site. http://googlewebmastercentral.blogspot.ch/2011/05/do-404s-hurt-my-site.html
- Dans certains cas, les erreurs d'analyse peuvent provenir d'un problème structurel légitime sur votre site Web ou votre CMS. Comment vous dites Vérifiez l’origine de l’erreur d’analyse. S'il existe un lien brisé sur votre site, dans le code HTML statique de votre page, cela vaut toujours la peine de le corriger. (merci + Martino Mosna )
- Qu'en est-il des URL funky qui sont "clairement cassées?" Lorsque nos algorithmes aiment votre site, ils peuvent essayer de trouver du contenu de qualité supérieure, par exemple en essayant de découvrir de nouvelles URL en JavaScript. Si nous essayons ces "URL" et trouvons un 404, c’est génial et attendu. Nous ne voulons simplement rien rater d’important (insérez ici le mot Googlebot trop lié). http://support.google.com/webmasters/bin/answer.py?answer=1154698
- Vous n'avez pas besoin de corriger les erreurs d'analyse dans les Outils pour les webmasters. La fonctionnalité "marquer comme fixe" est uniquement destinée à vous aider si vous souhaitez suivre vos progrès là-bas; cela ne change rien à notre pipeline de recherche Web, alors n'hésitez pas à l'ignorer si vous n'en avez pas besoin. http://support.google.com/webmasters/bin/answer.py?answer=24674
- Nous répertorions les erreurs d'analyse dans les outils pour les webmasters par priorité, en fonction de plusieurs facteurs. Si la première page d’erreurs d’analyse n’est manifestement pas pertinente, vous ne trouverez probablement pas d’erreurs d’analyse importantes dans les pages suivantes. http://googlewebmastercentral.blogspot.ch/2012/03/crawl-errors-next-generation.html
- Il n’est pas nécessaire de "réparer" les erreurs d’analyse sur votre site Web. Trouver 404 est normal et attendu d’un site Web sain et bien configuré. Si vous avez une nouvelle URL équivalente, il est recommandé d’y rediriger. Sinon, vous ne devriez pas créer de faux contenu, vous ne devriez pas rediriger vers votre page d'accueil, vous ne devriez pas non plus robots.txt interdire ces URL - toutes ces choses rendent plus difficile pour nous de reconnaître la structure de votre site et de la traiter correctement. Nous appelons ces erreurs "soft 404". http://support.google.com/webmasters/bin/answer.py?answer=181708
- Évidemment, si ces erreurs d’exploration apparaissent pour les URL qui vous intéressent, par exemple les URL de votre fichier Sitemap, vous devez agir immédiatement. Si Googlebot ne parvient pas à analyser vos URL importantes, elles risquent alors d’être supprimées de nos résultats de recherche et les utilisateurs risquent de ne pas pouvoir y accéder.
Il est également possible que Google ajoute ces numéros à l’URL un par un. Votre site se comporte de manière étrange. J'ai trouvé votre site et essayé /90s-unforgetable-memories-just-have-a-look/2317/
qui renvoie les mêmes pages que /90s-unforgetable-memories-just-have-a-look/
. Ce n'est que lorsque je mets un deuxième numéro sur l'URL qu'il renvoie un 404. Cela pourrait aider de configurer votre site pour éliminer ce problème de contenu en double. Une solution serait d'utiliser cette directive de redirection dans votre fichier . Htaccess :
RedirectMatch permanent /([a-z0-9\-]+\/)[0-9\/]+ /$1
Cette règle supprimera effectivement tous les numéros de fin et les barres obliques de vos URL et sera redirigée vers l'article. Vous n'aurez alors plus de contenu dupliqué ni de contenu 404.
Normalement, les erreurs 404 ne nuisent pas aux performances de votre site Web dans les résultats de recherche, mais trop d'erreurs 404 entraînent une expérience utilisateur médiocre. Il est donc préférable que vous vérifiiez votre site Web, supprimiez toutes les pages inutiles et répariez les liens rompus. Après avoir envoyé un nouveau plan du site sur votre site Web et dans l'outil Google pour les webmasters, vous constaterez sûrement une amélioration du nombre d'erreurs 404.