web-dev-qa-db-fra.com

Faux trafic organique de baidu à une page en particulier

Récemment, j'ai commencé à avoir des pics de trafic organique provenant de baidu vers une page particulière de mon site.

Landing pages for users from baidu

Tout d’abord, mon site a une version chinoise et j’ai besoin de visiteurs chinois. Donc, je ne veux pas bloquer complètement baidu.

Ok, j'ai commencé à enquêter. La durée moyenne de la session pour 90% de ces visites est de 0 secondes. Je suppose donc que ce ne sont pas de vrais visiteurs.

J'ai commencé à rassembler les statistiques pour cette page avec PHP variables $ _SERVER ['REMOTE_ADDR'] et $ _SERVER ['HTTP_REFERER'] et voici les résultats (pour les deux derniers jours):

Nombre total d'adresses IP = 3876

Nombre d'adresses IP uniques = 3118

Nombre maximal de hits d'une adresse IP particulière = 9

Total http_referer = 3586

Http_referer unique = 3278

Nombre maximum de la même page de référence = 5.

Le problème est que les pages de renvoi semblent être des pages valides. Ils ressemblent à ceci: https://www.baidu.com/link?url=uQ3Foy5eYozYEq1wDKYDUqlbF_W-umpEZAMyulIp-MqiVUqPPdFUtT5_Xumavs7gKlfnZXv15-2H69EbcOkWbnXQua97JF4R45zzMO10LJY5yHlIxC2fZa-dX6JeMtLDut3VWu08nrbzFVt0XjgI5_&wd=&eqid=faceb5600002fa4d00000002585c8f6e

C'est l'adresse encodée telle qu'elle apparaîtrait dans les résultats de la recherche baidu et elle redirigera vers la page en question.

Quelqu'un a une idée de la raison pour laquelle cela se produit et que puis-je faire à ce sujet?

P.S. Depuis longtemps, j'ai un filtre dans GA pour bloquer tous les autres noms d'hôte, à l'exception de mon propre site.

UPDATE 1: Info sur HTTP_USER_AGENT (pour les 24 dernières heures):

Total http_user_agent = 1804

Http_user_agent unique = 607

Les agents utilisateurs les plus fréquents comptent:

AppleWebKit/537.36 (KHTML, comme Gecko) Mozilla/5.0 (Windows NT 5.1) Chrome/45.0.2454.101 Safari/537.36 => 125 hits

Mozilla/5.0 (compatible; Baiduspider/2.0; + http://www.baidu.com/search/spider.html ) => 108 hits

Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/45.0.2454.101 Safari/537.36 => 81 hits

Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/47.0.2526.108 Safari/537.36 2345Explorer/8.2.2.14352 => 56 hits

Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/47.0.2526.108 Safari/537.36 2345Explorer/8.2.2.14352 => 50 hits

7
easypronunciation

Inscrivez-vous sur la plateforme baidu webmsater et modifiez la "pression des chenilles" - afin de limiter la fréquence à laquelle l'araignée baidu visite votre site.

Voici le tutoriel que j'ai suivi pour un client - http://bbs.zhanzhang.baidu.com/thread-44-1-1.html

1
Chris Quinn

Si vous utilisez Nginx, il pourrait y avoir des solutions pour bloquer ce type de spam. Voici une solution sur Server Fault: https://serverfault.com/questions/646342/is-there-an-elegant-way-to-block-a-bunch-of-referrers-at-once

Je suis sûr que Apache et d'autres serveurs ont également des solutions.

0
Sascha Grindau