Il y a quelques heures à peine, je vérifiais mes journaux lorsque j'ai trouvé tout un trafic provenant de l'adresse IP 54.174.xx.xx
et du fournisseur de services Internet Amazon.com (validé par Google Analytics). Cela a duré une heure et tout semble normal.
C'est quelque chose de très anormal. J'ai enquêté plus loin et suis confus de constater que ce n'était pas réellement un bot (enfin, je suppose) parce que je peux voir les utilisateurs (par exemple avec ip 54.174.59.201
) a même cliqué sur les vignettes dans la barre latérale. Cependant, les navigateurs, le système d'exploitation et les résolutions d'écran sont les mêmes pour toutes les sessions.
Quelle est la cause et que faire?
Nous avons eu le même problème et il s'est avéré que c'était Pingdom (service de surveillance de site Web).
Quelqu'un l'avait configuré pour envoyer des requêtes ping sur notre site toutes les 5 minutes et ouvrir une session, ce qui a entraîné des milliers de visites par mois d'Ashburn, VA avec un fournisseur de services d'Amazon. Le temps passé sur le site ne représentait qu'une fraction de seconde à chaque fois.
Pingdom suggère d'activer le blocage du trafic bot connu via un paramètre dans GA: https://help.pingdom.com/hc/en-us/articles/212979949-What-analytics-will-Pingdom-checks-and-products -trigger -
Il est important de faire attention ici: Amazon n'est pas simplement un fournisseur de site Web, il est également un fournisseur de services cloud et propose également un service permettant aux utilisateurs d'accéder à une interface de poste de travail virtualisé sur le réseau Amazon en tant que session de poste de travail distant. Ce service particulier utilise une passerelle Windows Server. Par conséquent, la résolution du bureau et les empreintes digitales du système d'exploitation sont généralement les mêmes. Le simple fait d’afficher ces entrées dans vos journaux n’est pas une mauvaise chose en soi, à moins que vous ne voyiez du trafic indiquant qu’ils tentent de violer la sécurité de votre site ou qu’ils utilisent les services pour exécuter des actions malveillantes ou envoyer du spam sur votre site.
NOTE: Je m'appellerais un développeur n00b de Down Under.
En ce qui concerne le PO, une recherche sur Google de l’IP ci-dessous m’entraîne ici.
Afin de minimiser le spam, configurez ce mauvais trou noir conformément à: https://perishablepress.com/blackhole-bad-bots/
Le premier coup rapporté par Blackhole, en partie, fut:
Le mardi 27 novembre 2018 @ 11:36:37
Requête d'URL:/blackhole/Adresse IP: 52.200.221.20 Agent utilisateur: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, comme Gecko) Chrome/22.0.1216.0 Safari/537.2
Whois Lookup:
Les données et services WHOIS d'ARIN sont soumis aux Conditions d'utilisation disponibles à l'adresse suivante: https://www.arin.net/whois_tou.html Si vous constatez des inexactitudes dans les résultats, merci de signaler à l'adresse https://www.arin.net/resources/whois_reporting/index.html Copyright 1997-2018, Registre américain pour Internet Numbers, Ltd.
NetRange: 52.192.0.0 - 52.223.255.255 CIDR: 52.192.0.0/11 NetName: AT-88-Z NetHandle: NET-52-192-0-0-1 Parent: NET52 (NET-52-0-0-0- 0) NetType: origine de l'allocation directe:
Organisation: Amazon Technologies Inc. (AT-88-Z) Date de démarrage: 2015-09-02 Mise à jour: 2015-09-02 Réf: https://rdap.arin.net/registry/ ip/52.192.0. OrgName: Amazon Technologies Inc. OrgId: AT-88-Z Adresse: 410 Terry Ave N. Ville: État de SeattleProv: WA Code postal: 98109 Pays: Date d'enregistrement: 2011-12-08 Mise à jour: 2017 -01-28
S'il s'agissait d'un bot légitime, il aurait PAS essayé d'accéder à ce répertoire/blackhole car le fichier robots.txt l'a spécifiquement interdit.
AbuseIPDB rapports: 52.200.221.20 a été trouvé dans notre base de données!
Cette adresse IP a été rapporté 49 fois. La confiance en l'abus est de 43%
Pour moi, le code de trou noir montre qu'il ne s'agit pas d'un comportement légitime et que maintenant, il est interdit à IP d'accéder au site qu'il cible. La vigilance est donc primordiale.