Je vois dans mon journal d’accès un certain nombre de requêtes très suspectes:
/i
/im
/imaa
/imag
/image
/images
/images/d
/images/di
/images/dis
Ils se séparent d'une ressource connue (dans l'exemple ci-dessus /images/disrupt.jpg).
Tous venant de la même adresse IP. Les demandes varient de 1/s à 10/s, semble quelque peu aléatoire.
C'est évidemment qu'ils essaient de trouver quelque chose et semblent utiliser un script.
Comment puis-je bloquer ce genre de comportement? Je pensais bloquer la demande IP, au moins pour un temps donné. Gardant à l'esprit que:
Finalement, j'ai trouvé qui était le responsable, c'était un javascript qui essayait de charger les ressources en temps réel lorsque quelqu'un écrivait un article.
Tandis que l’utilisateur tapait l’URL d’une image, le script a essayé de la charger même si le chemin n’était pas complet, d’où les 404 journaux.
Utilisent-ils toujours la même adresse IP?
Non, on peut s’attendre à ce que les moteurs de recherche utilisent diverses adresses IP - mais ils utilisent toujours le même système autonome (et tous les principaux moteurs de recherche ont leur propre AS).
Si vous avez l'adresse IP, vous pouvez aller à ARIN et utiliser "Recherche WHOIS" dans le coin supérieur droit de la page pour rechercher le système autonome associé à l'adresse IP.