Récemment, j'ai commencé à avoir des pics de trafic organique provenant de baidu vers une page particulière de mon site.
Tout d’abord, mon site a une version chinoise et j’ai besoin de visiteurs chinois. Donc, je ne veux pas bloquer complètement baidu.
Ok, j'ai commencé à enquêter. La durée moyenne de la session pour 90% de ces visites est de 0 secondes. Je suppose donc que ce ne sont pas de vrais visiteurs.
J'ai commencé à rassembler les statistiques pour cette page avec PHP variables $ _SERVER ['REMOTE_ADDR'] et $ _SERVER ['HTTP_REFERER'] et voici les résultats (pour les deux derniers jours):
Nombre total d'adresses IP = 3876
Nombre d'adresses IP uniques = 3118
Nombre maximal de hits d'une adresse IP particulière = 9
Total http_referer = 3586
Http_referer unique = 3278
Nombre maximum de la même page de référence = 5.
Le problème est que les pages de renvoi semblent être des pages valides. Ils ressemblent à ceci: https://www.baidu.com/link?url=uQ3Foy5eYozYEq1wDKYDUqlbF_W-umpEZAMyulIp-MqiVUqPPdFUtT5_Xumavs7gKlfnZXv15-2H69EbcOkWbnXQua97JF4R45zzMO10LJY5yHlIxC2fZa-dX6JeMtLDut3VWu08nrbzFVt0XjgI5_&wd=&eqid=faceb5600002fa4d00000002585c8f6e
C'est l'adresse encodée telle qu'elle apparaîtrait dans les résultats de la recherche baidu et elle redirigera vers la page en question.
Quelqu'un a une idée de la raison pour laquelle cela se produit et que puis-je faire à ce sujet?
P.S. Depuis longtemps, j'ai un filtre dans GA pour bloquer tous les autres noms d'hôte, à l'exception de mon propre site.
UPDATE 1: Info sur HTTP_USER_AGENT (pour les 24 dernières heures):
Total http_user_agent = 1804
Http_user_agent unique = 607
Les agents utilisateurs les plus fréquents comptent:
AppleWebKit/537.36 (KHTML, comme Gecko) Mozilla/5.0 (Windows NT 5.1) Chrome/45.0.2454.101 Safari/537.36 => 125 hits
Mozilla/5.0 (compatible; Baiduspider/2.0; + http://www.baidu.com/search/spider.html ) => 108 hits
Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/45.0.2454.101 Safari/537.36 => 81 hits
Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/47.0.2526.108 Safari/537.36 2345Explorer/8.2.2.14352 => 56 hits
Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/47.0.2526.108 Safari/537.36 2345Explorer/8.2.2.14352 => 50 hits
Inscrivez-vous sur la plateforme baidu webmsater et modifiez la "pression des chenilles" - afin de limiter la fréquence à laquelle l'araignée baidu visite votre site.
Voici le tutoriel que j'ai suivi pour un client - http://bbs.zhanzhang.baidu.com/thread-44-1-1.html
Si vous utilisez Nginx, il pourrait y avoir des solutions pour bloquer ce type de spam. Voici une solution sur Server Fault: https://serverfault.com/questions/646342/is-there-an-elegant-way-to-block-a-bunch-of-referrers-at-once
Je suis sûr que Apache et d'autres serveurs ont également des solutions.