web-dev-qa-db-fra.com

Comment puis-je empêcher le spam sur les sites que je contrôle?

Ceci est une question générale du wiki de la communauté qui aborde toutes les questions non spécifiques relatives à la prévention du spam.

Si votre question était fermée en tant que duplicata de cette question et que vous estimiez que les informations fournies ici ne fournissaient pas une réponse suffisante, veuillez ouvrir la discussion sur Pro Webmasters Meta .


Aux fins de cette question, le spam comprendra:

  • Tout poste automatisé
  • Contenu posté manuellement comprenant des liens vers des sites de spammeurs
  • Contenu posté manuellement qui inclut des instructions pour visiter le site d'un spammeur
27
danlefree

La liste suivante est organisée par facilité d’implémentation relative, coût de maintenance et efficacité de la prévention du spam:

Désactiver tout le contenu généré par l'utilisateur

Il s’agit d’une solution à base de terre brûlée qui nuit à la croissance d’une communauté d’utilisateurs autour de votre site. Toutefois, elle vous garantit également une économie de temps et d’efforts pour traiter le spam ou la prévention du spam.

À part la désactivation du contenu généré par l’utilisateur, il n’existe aucune solution garantie pour empêcher l’apparition de tous les spams (ou autres contenus indésirables), mais une solution qui dissuade la plupart les spammeurs devraient suffire si vous offrez également aux visiteurs de votre site la possibilité de signaler le contenu en tant que spam.

Externaliser la gestion de contenu généré par l'utilisateur

Des services tels que Disqus permettent aux webmasters d’externaliser le filtrage, le stockage et la publication de commentaires générés par les utilisateurs. (Remarque: l'utilisation d'un service tiers nécessite configuration supplémentaire pour s'assurer que les commentaires seront indexés par les moteurs de recherche)

CAPTCHA

Par Wikipedia , CAPTCHA signifie "Test de Turing public entièrement automatisé pour différencier les ordinateurs des êtres humains". Tout test automatisé conçu pour empêcher un ordinateur d’afficher du contenu est un CAPTCHA: il consiste à obliger les utilisateurs à lire des lettres, des chiffres et des mots dans des images, à résoudre de simples énigmes Word ou des questions mathématiques, ou à "prouver" qu’ils sont des personnes.

L’inconvénient de CAPTCHA est que

  1. La plupart des formes de CAPTCHA offrent un niveau de gêne aux utilisateurs.

  2. Ils ne sont pas à 100% de protection. Notez que bon nombre de ces tests peuvent être effectués sur ordinateur si un programmeur compétent décide d’investir suffisamment de temps et d’efforts pour résoudre le problème.

Q & R CAPTCHA

La solution CAPTCHA la plus efficace pour les petits sites est la question et la réponse CAPTCHA. Q & R CAPTCHA est une question à laquelle un site Web demande à un utilisateur de répondre. La question est quelque chose que toute personne visitant le site saurait, mais qu'un programme d'ordinateur ne le saurait pas. Un exemple de question pour un site sur le référencement serait "Qu'est-ce que le SEO signifie". Il serait facile pour le lecteur moyen de ce site de répondre à cette question, mais aucun programme informatique ne pourrait le faire.

REMARQUE: les questions telles que "qu'est-ce que 1 + 1" ne fonctionnent pas bien, car elles sont souvent utilisées, et les personnes qui construisent des spambots les programment pour qu'elles répondent correctement à ces questions.

Toutefois, si votre site génère beaucoup de trafic, les spammeurs programmeront leurs robots pour qu'ils répondent automatiquement à ces questions, et le CAP & CHA ne sera plus affectif.

Champ caché

Si vous avez un formulaire et que vous ne voulez pas que les spammeurs puissent l'utiliser, un bon moyen de les arrêter consiste à utiliser un champ caché. Celles-ci sont très simples à configurer: ajoutez un champ redondant à votre formulaire, masquez-le via css (ou JavaScript) et arrêtez tout ce qui tente d'entrer une valeur dans ce champ. Les utilisateurs normaux ne pourront pas voir le champ et l'ignoreront, car il ne leur est pas caché, mais les programmes informatiques employés par les spammeurs essaieront de saisir une valeur dans ce champ, car ils ne traitent ni CSS ni javascript. Pour vaincre les robots spammeurs qui chargent CSS ou Javascript, vous pouvez ajouter un champ supplémentaire aux formulaires en demandant de le laisser vide. Tout visiteur humain le laissera vide et vous pourrez facilement bloquer les robots qui ajoutent des données au champ. N'oubliez pas que cela peut donner l'impression que le site n'est pas professionnel.

Analyse du trafic et du contenu

Les spammeurs ont un nombre limité de réseaux et de machines à publier (qu'ils utiliseront généralement jusqu'à ce qu'ils ne fonctionnent plus). Les solutions d'analyse du trafic collectent les données d'un grand nombre d'hôtes pour déterminer si une publication contient un contenu spam connu ou provient d'un hôte ou d'un réseau de polluposteur connu.

Diverses solutions tierces d'analyse de CAPTCHA et d'analyse du trafic sont gratuites (ou peu coûteuses) et la plupart des logiciels de gestion de contenu open source incluent des modules intégrés pour l'utilisation de services tels que Akismet et reCAPTCHA .

Bloquer les mots généralement contenus dans le spam

Si vous remarquez que le spam sur votre site Web contient généralement des mots qui ne sont pas (ou ne sont pas) utilisés par des utilisateurs légitimes (tels que "liens gratuits vers votre site"), le fait d'empêcher les utilisateurs de publier ces mots est une solution efficace. Si vous craignez que les utilisateurs qui utilisent ces mots de manière légitime dans leurs publications et qui rencontrent des problèmes pour publier des messages sur votre site, vous pouvez définir le filtre pour qu'il ignore les publications d'utilisateurs établis.

rel="nofollow"

Les spammeurs ont tendance à se concentrer sur les sites qui leur permettent d’afficher des liens que les moteurs de recherche suivront (améliorant ainsi le rang de recherche du site qu’ils annoncent).

Vous pouvez rendre votre site moins attrayant pour les spammeurs en ajoutant rel="nofollow" à tous les liens inclus dans le contenu généré par l'utilisateur. Toutefois, cette approche risque de ne pas fonctionner car la plupart des spams sont automatisés et les spammeurs n'ont aucun moyen de savoir si oui ou non un site utilise des liens rel="nofollow".

Modération par les utilisateurs

Le contenu peut être publié par n'importe qui. Cependant, une fois affiché sur le site, il peut également être marqué comme spam et supprimé (cette option ne fonctionne en pratique que si les visiteurs perçoivent le contenu du spam comme étant relativement inhabituel: si le spam est autorisé à dépasser les commentaires utiles. , la plupart des visiteurs ne se soucieront pas de signaler le spam).

Gamification

La gamification est un excellent moyen de motiver les utilisateurs à signaler les spams. Envisagez d'ajouter une fonction "d'indicateur" à votre site: plus le nombre de spams signalés est élevé, plus ils obtiennent de points. Cela rendra la chasse au spam plus amusante et donnera aux personnes qui signalent des vantardises du spam. Cela encouragera les utilisateurs à signaler les spams.

Modération par les administrateurs

Un utilisateur doit examiner chaque élément de contenu publié avant sa publication sur le site. Même si cela n'empêche pas l'envoi de spam, il empêche son affichage aux visiteurs du site (ce qui réduit la valeur du site pour les spammeurs humains). .

Enregistrement de l'utilisateur

L’enregistrement d’utilisateur est une amélioration par rapport à CAPTCHA car les utilisateurs ne sont obligés de prouver qu’ils sont humains une fois avant d’être autorisés à commenter à leur convenance - ce n’est pas techniquement une forme différente de prévention du courrier indésirable, bien que cela facilite la suppression du courrier indésirable créé par un utilisateur ou un groupe d'utilisateurs spécifique (identifié par un nom d'utilisateur, un courrier électronique, une adresse IP ou un autre facteur d'identification).

Modérer les nouveaux utilisateurs

Au lieu d’approuver chaque publication, un administrateur peut examiner les nouvelles inscriptions d’utilisateurs pour déterminer s’il convient d’approuver un utilisateur, selon que son inscription correspond ou non aux spammeurs identifiés ou aux spambots automatisés.

Limiter les capacités des nouveaux utilisateurs

Les spammeurs humains se souviendront rarement de revenir aux comptes qu’ils ont créés s’ils ne peuvent pas publier de spam librement sur un compte. Les nouveaux utilisateurs doivent créer un nombre défini de publications (si la communauté a la capacité de signaler le spam) et/ou attendre un ensemble. le temps nécessaire avant que les restrictions sur la publication de liens ou de plusieurs publications soient supprimées.

Charge les utilisateurs pour l'adhésion

Si vous facturez votre adhésion, même si les frais sont minimes, les spammeurs seront obligés de comparer le coût de leur adhésion à la valeur de l'envoi de spam sur votre site (et de passer votre site au profit de cibles plus faciles).

Inviter seulement

Si vous autorisez uniquement les personnes qui ont été invitées par d'autres utilisateurs à s'enregistrer, cela réduira considérablement le spam (les humains n'invitent généralement pas de robots).

Ce qui suit est de Projet BOTCHA , Drupal.

Pot de miel

Implémentation de honeypot-trap . En résumé, le champ est ajouté au formulaire avec une certaine valeur, qui est ensuite modifiée par JS. Le spam est toute soumission de formulaire dont la valeur calculée n'est pas la même que celle dont nous avons besoin.

HoneyPot2

Comme ci-dessus, mais en utilisant comme source de calcul, pas la valeur d'un champ particulier, mais les données de CSS.

ObscureUrl

Similaire à HoneyPot2: construit par JS est comparé au besoin. La différence est que la valeur initiale est transmise par le paramètre GET.

Conclusion

La plupart des webmasters s'aperçoivent qu'un mélange des solutions répertoriées ci-dessus (à l'exception de l'interdiction du contenu généré par l'utilisateur) fonctionne mieux pour leur site et au moins solution doit être mise en œuvre pour empêcher le spam automatisé d'étouffer les discussions des visiteurs.

27
danlefree

Nous avons récemment éliminé le spam de notre formulaire Contactez-nous avec une implémentation très simple. Nous avons ajouté une entrée intitulée "URL:" dans le formulaire HTML et l'avons rendue invisible pour les utilisateurs réels. Ensuite, dans le processeur de formulaire, nous vérifions si elle a une valeur et agissons en conséquence.

Les spambots prennent l'appât tout le temps; ils ont mis une URL à un site spammy. Notre scénario le voit et rejette le commentaire (en fait, nous recyclons les éléments, car nous essayons d'être une entreprise plus respectueuse de l'environnement et plus respectueuse de l'environnement). Pendant un certain temps, nous conservions le commentaire incriminé dans une table de la base de données pour examen, mais nous refusions d'envoyer les résultats par courrier électronique. C'est comme ça que nous savons que cela a fonctionné.

Avec cette méthode simple, nous sommes passés de plus de 30 spams "Nous contacter" par jour à zéro.

Bonne chance avec quoi que tu choissises!

5
WebDevKev

J'ai un forum sur lequel j'ai temporairement activé des publications anonymes. Je ne voulais pas utiliser Captcha, car j’ai souvent moi-même des difficultés à les lire, ce qui peut empêcher les gens de faire des commentaires. Pour prévenir le spam, j’ai utilisé Akismet pour intercepter les messages en attente. Akismet n'est pas à l'épreuve des balles, mais cela m'a beaucoup facilité la vie.

Vous devez cependant être conscient des faux positifs. Donc, ce que j'ai fait était de créer un "attribut de spam" sur mon objet de publication et de le définir sur la valeur de retour de Akismet. Si un message était marqué comme spam, je me donnais moi-même et un courrier électronique, après quoi je pouvais décider s'il s'agissait ou non de spam.

1
Dofs

S'il vous plaît visitez MediaWiki.
Recherche d'une extension: Modération
Cette extension vous aidera à empêcher le spam sur les sites que vous contrôlez.
J'ai utilisé cette extension MediaWiki plusieurs fois.
Et cela empêche les bots de créer des articles de spam.

0
jehovahsays