Je passais en revue les journaux de mon site Web (WordPress) et j'ai vu une ligne comme celle-ci:
myWebsite:80 5.10.83.28 - - [17/Jan/2014:09:05:53 +0000] "GET myUrl == HTTP/1.1" 404 5716 "-" "Mozilla/5.0 (compatible; AhrefsBot/5.0; +http://ahrefs.com/robot/)"
Ainsi, un robot appelé AhrefsBot
visitait myUrl
.
Le problème est que j'ai supprimé la page myUrl
il y a quelques semaines. Alors, pourquoi ce bot me le demande-t-il toujours?
Comment a-t-il trouvé l'URL myUrl
, surtout quand je suis sûr qu'il n'y a pas de pages qui y sont liées? Et comment puis-je éviter ce genre de 404 pages?
Il existe plusieurs raisons pour lesquelles un bot essaierait de visiter une page supprimée:
Le comportement des robots dépend généralement de facteurs que vous ne pouvez pas voir et qui, par conséquent, ne vous apparaîtront souvent pas comme étant tout à fait rationnels. Il n'y a aucun moyen de les empêcher absolument de déclencher des 404.
Il y a 2 raisons possibles: