web-dev-qa-db-fra.com

Comment lutter contre les spammeurs Google Analytics?

Les mois derniers, j'ai beaucoup de spammeurs référents dans mes statistiques GA. Leur nombre est environ 10 fois supérieur au nombre de visiteurs légitimes (mon site n’est pas encore très populaire). J'ai activé une option pour masquer les spammeurs connus dans les paramètres GA, mais cela n'a pas aidé du tout. Il semble que ces spammeurs utilisent des scripts pour envoyer du spam directement à GA (c’est-à-dire qu’ils ne sont pas enregistrés dans mes IIS).

Est-ce que je peux faire quelque chose pour arrêter ces spammeurs?

UPD 10 mois plus tard, ils ont commencé à envoyer des pourriels en utilisant de faux noms de pages cibles ... et Google ne fait toujours rien à ce sujet.

43
user626528

Le spam devient incontrôlable. La liste s'allonge et il est fastidieux et même inutile d'ajouter un filtre pour chacun des spammeurs , car la plupart d'entre eux sont diffusés pendant quelques jours. et puis disparaissent et un nouveau vient.

Il y a beaucoup de désinformation, l’erreur la plus courante est de recommander l’utilisation du .htaccess , ce fichier bloque l’accès au site Web, bien qu’il existe un Quelques robots (5 ou 6) pouvant être bloqués, , la grande majorité des spams n’ont jamais accès à votre site est Ghost Spam.

Le meilleur moyen d'arrêter ce type de spam (Ghosts) consiste à créer un filtre de nom d'hôte valide , le spam fantôme utilise un nom d’hôte faux ou non défini, ce qui vous évite d’ajouter d’innombrables filtres (. Un filtre prend en charge les anciens et nouveau spam . Utilise cette solution avec succès depuis 3 mois

Plus d'informations sur cette méthode ici:

https://stackoverflow.com/a/28354319/3197362

D'accord. Sans connaître les sites en question, je vais essayer d'expliquer un peu ce qui se passe et de ne fournir que quelques liens.

De: http://www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

Je reçois les noms de domaine suivants associés à la nouvelle méthode de spam par parrain que les internautes voient récemment.

  • BlackHatWorth.com
  • Iskalko.ru
  • Lomb.co
  • Lombia.co
  • Econom.co
  • Darodar.com
  • ILoveVitaly.Com
  • Priceg.com
  • Hulfingtonpost.com (ajouté le 16 janvier 2015)
  • Bestwebsitesawards.com (New- ajouté le 3 février 2015)
  • Ranksonic.info (Nouveau - ajouté le 3 février 2015)
  • Cenoval.ru (New- ajouté le 6 février 2015)
  • o-o-6-o-o.com (New- ajouté le 25 février 2015)
  • Humanorightswatch.org (ajouté le 4 mars 2015)
  • S.click.aliexpress.com (New- ajouté le 17 mars 2015 - Suspecté)
  • www1.social-buttons.com (New- ajouté le 23 mars 2015 - Suspecté)
  • 4webmasters.org (New- ajouté le 26 mars 2015 - Suspecté)
  • Googlsucks.com (Nouveau - ajouté le 07 avril 2015)
  • Addons.mozilla.org (New- ajouté le 07 avril 2015 - Suspecté)
  • Smallseotools.com (Nouveau - ajouté le 13 avril 2015 - Suspecté)
  • Theguardlan.com (Nouveau - ajouté le 14 avril 2015)
  • Buy-cheap-online.info (New- ajouté le 16 avril 2015 - Suspecté)
  • Site1.free-share-buttons.com (Nouveau - ajouté le 29 avril 2015 - Suspecté)
  • Sanjosestartups.com (ajouté le 25 mai 2015)
  • Trafficmonetize.org (New- ajouté le 03 juin 2015 - Suspecté)
  • Howtostopreferralspam.eu (New- ajouté le 09 juin 2015 - Suspecté)
  • Www10.free-social-buttons.com (New- ajouté le 16 juin 2015 - Suspecté)
  • Getitfree.fr (Nouveau - ajouté le 18 juin 2015 La propriété ne peut pas être déterminée. Merci - Trey Copeland)
  • Www6.free-social-buttons.com (New- ajouté 18 juin 2015 - Suspecté)
  • Erot.co (New- ajouté le 26 juin 2015 - Suspecté)
  • 3g2upl4pq6kufc4m.onion (New- ajouté le 04 juillet 2015 - Suspecté)
  • Traffic2money.com (New- ajouté le 28 juillet 2015 - Suspecté)

Remarque: les éléments suspectés semblent suivre le même schéma de propriété et ne peuvent pas être liés au même auteur.

Vous trouverez une liste assez exhaustive de référenceurs de spam maintenus par Piwik à l’adresse suivante: https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt (Merci - utilisateur2428118 )

Citer:

BlackHatWorth.com est un domaine relativement nouveau créé le 7 janvier 2015 et qui est maintenant utilisé pour le spam parrainé. En fait, ce site Web de parrainage-spam est caché derrière le nom du moteur de recherche de magasinage et de belles images de paysages.

... l'adresse IP de BlackHatWorth.com, qui est 78.110.60.230, est la même que celle associée à d'autres sites Web de spam parrainé ...

En fait, le domaine BlackHatWorth.com appartient au même Russe, qui est également propriétaire des autres domaines de spam de renvoi, tels que ILoveVitaly.com, Econom.co et Darodar.com. Le propriétaire du domaine est censé être Vitaly A Popov de Samara (ville), Samaraskaya Oblast (État), Russie.

Vous ne pouvez pas bloquer ceci!

De: http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

Citer:

Voici un bref aperçu du fonctionnement de Google Analytics.

Donc, vous obtenez la configuration sur GA et vous obtenez un code. Le code ressemble à UA-numéro-1 ou quelque chose du genre. Ce numéro est votre "numéro de compte" sur GA. Maintenant, ce code et un peu de javascript vont sur votre page Web. Maintenant, quelqu'un visite votre page et son navigateur exécute ce code javascript.

Ce code javascript est ce que "enregistre" leur visite. Il fait parler leur navigateur à Google Analytics. Plus précisément, il effectue certains types de demandes HTTP pour lesquelles Google enregistre des informations, puis GA affiche des résumés de ces informations.

Assez basique, non? Encore avec moi? Bon, maintenant, si tout ce que c’est, c’est ce Javascript qui leur envoie la "visite", alors tout le monde peut simuler cela. Tout le monde. Tout ce que je dois faire pour que votre GA affiche de fausses informations est d’envoyer mes fausses informations directement à GA.

Je n'ai pas du tout besoin de visiter votre site. Je n'ai pas du tout besoin d'exécuter javascript. J'ai juste besoin de reproduire ces requêtes HTTP, qui sont publiques, afin que tout le monde puisse les voir et voir comment elles fonctionnent. Ils sont même assez bien documentés, publiquement, par Google eux-mêmes.

Alors, disons que je suis un imbécile de spammeur. Je veux amener les gens à voir mon site spam. Alors qu'est-ce que je fais? J'écris un petit morceau de code pour envoyer des milliers et des milliers de ces fausses demandes à GA, et je fais simplement défiler tous les numéros d'agent utilisateur, dans l'ordre, au hasard, peu importe. J'envoie une fausse visite, avec un faux référent, et mon nom de domaine spammy. Et devine quoi? Il apparaît dans vos écrans Google Analytics.

Vous voyez ce spam comme n'importe quelle autre visite normale. En ce qui concerne GA, il s’agissait d’une visite normale. Ils n’enregistrent que les requêtes HTTP, qui proviennent normalement du code javascript GA. Mais une demande est une demande, et en créer une fausse est très, très facile.

C'est ce qui se passe. Tout ce dont j'ai besoin, c'est de votre numéro d'agent utilisateur et, avec un petit effort, je peux simuler une visite sur votre site sans même vous connecter réellement à votre site. Cette fausse visite peut contenir n’importe quel nom de domaine et n’importe quel référent que je choisis.

Il s’agit d’une attaque contre Google Analytics, destinée à promouvoir le contenu du site. Vous ne pouvez pas le bloquer sur votre serveur, car votre serveur n'est pas impliqué du tout.

Vous pouvez faire deux choses: premièrement, installez un filtre comme le suggère John Conde; et deuxièmement, voyez s’il existe un moyen d’informer Google. Pour cela, je n'ai pas de réponse, mais j'ai une idée.

[Mettre à jour]

Cela commence à prendre des proportions scandaleuses, allant de centaines de spams par jour à des publicités comme celle-ci:

enter image description here

35
closetnoc

Vous pouvez les exclure en créant un filtre . Vous devez trouver quelque chose d'assez précis pour ne pas bloquer accidentellement les bons visiteurs et c'est fastidieux, car vous devez ajouter manuellement chaque spammeur, mais cela fera l'affaire.

5
John Conde

Pour répondre directement à votre question de titre "Comment lutter contre les spammeurs référents", la réponse la plus simple consiste à abandonner Google Analytics et passer à Piwik , qui automatiquement bloque tout le spam du parrain par défaut .

Je me rends compte que vous êtes probablement habitué à Google Analytics et que vous souhaitez continuer à l'utiliser, mais si vous regardez le tableau dans son ensemble, vous avez une autre option qui fonctionne très bien. Piwik peut également être configuré pour enregistrer les adresses IP des visiteurs si vous le souhaitez, et ne transmet pas les données des visiteurs à des agences de publicité tierces susceptibles de plaire à certains utilisateurs.

4
Tom Brossman

Si vous êtes toujours à la recherche d'une solution et que vous ne comprenez pas les références faites, voici le guide définitif pour éliminer les spams de parrainage. Il s'agit maintenant de la 133ème révision depuis le 28 décembre 2014: http: //www.analyticsedge .com/2014/12/removal-referral-spam-google-analytics /

TL; DR:

  • un filtre de nom d'hôte valide supprimera toutes les références fantômes (inclure le nom d'hôte mydomain.com)

  • un filtre d'exclusion spécifique (ou le blocage de sites Web) supprimera la liste beaucoup plus courte des robots d'exploration de spam (semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | buttons-for -website.com | button-for-your-website.com | -musicas * -gratis | anticrawler.org | savetubevideo.com | ranksonic)

  • un segment avancé peut être utilisé pour les supprimer de vos rapports historiques.

Le segment avancé peut être importé à partir de la galerie de solutions Google Analytics: https://www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_ .type% 3DADVANCED_SEGMENT% 26_.viewId% 3DGjpPQhFgS9aVzniXH4MTIg /

1
Mike Sullivan

Voici une règle qui fonctionne sur IIS:

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>
1
Flo

Au début de l'année dernière, j'avais pour tâche de trouver la meilleure solution possible au spam de Google Analytics. Comme tout le monde, j’ai essayé les approches recommandées mais rien ne semblait bien fonctionner. Alors, je me suis ensuite tourné vers Google Tag Manager, mais cela ne m'a pas beaucoup aidé non plus. Frustré et vexé, j'ai décidé de reconstruire le script de suivi de Google Analytics, en intégrant des contre-mesures contre les formes de spam les plus courantes et les plus gênantes.

Bien que n'étant pas parfait, après environ un an et demi de construction, de test, de débogage et de refactoring, j'ai maintenant un script de suivi Google Analytics assez fiable, qui fonctionne parfaitement et qui est facilement personnalisable. Pour ceux qui veulent remplir des métriques, cela fonctionne comme un charme.

https://github.com/nickolasburr/intelligent-ga-tracking

0
nburr