Je gère un site Web qui fournit des métadonnées provenant de l'électronique spécialisée (données comme le poids, les dimensions, les applications, la tension, etc.). Il compare également les produits en utilisant toutes ces données afin que l'utilisateur puisse voir les différences entre deux produits.
J'ai beaucoup de travail pour rechercher ces données et les placer dans une base de données structurée pour mon site Web.
Un concurrent a créé un "robot à chenilles" qui analyse automatiquement mon site Web, saisit toutes les données structurées et les reproduit sur son propre site Web. Il lit le code HTML, analyse les tableaux, obtient les valeurs, il obtient même les "descriptions d'info-bulles" que j'ai écrites pour chaque propriété, et avec toutes ces données, il alimente sa propre base de données afin qu'il puisse afficher les données comme il le souhaite.
Je place un nouveau produit sur mon site Web, et le produit est sur le site Web des concurrents quelques heures plus tard. Ce n'est pas une "simple copie HTML". Il analyse toutes les données et les enregistre de manière structurée. Il télécharge même toutes les images du produit et les héberge sur son propre serveur. C'est un robot à chenilles assez avancé.
Je veux un moyen d'empêcher mon concurrent de faire ça.
J'avais l'intention de bloquer tout son pays sur mon WebServer, mais je suppose que cela ne l'arrêtera pas très longtemps. Il trouvera probablement un moyen de contourner cela (je le ferais).
De plus, je ne peux pas simplement "encoder l'image" mes données parce que c'est très hostile au référencement. Et j'ai besoin de Google pour me trouver.
Que suggérez-vous?
En règle générale, tout ce qui est visible au public peut être exploré par des robots sophistiqués. Les emplacements peuvent être truqués, les adresses IP peuvent être masquées, les solutions captcha peuvent être achetées.
Votre meilleur recours dans ce cas peut être par voie légale. Commencez par envoi d'une demande de retrait DMCA à Google pour que son site soit retiré de la recherche Google, ce qui devrait le ralentir. Si le concurrent se trouve dans une juridiction que vous pouvez toucher légalement, vous pouvez également envisager de parler avec un avocat de la création d'un piège du droit d'auteur fictif .
Ce fil similaire contient des conseils pour savoir si un concurrent vole votre contenu et se classe au-dessus de vous dans la recherche Google, ce qui pourrait être utile:
n autre site Web est en miroir et se classe au-dessus de mon site dans les résultats de recherche
Je ne suis pas avocat et ce n'est pas un conseil juridique.
Des connards comme celui-ci sont entrés en ligne presque au moment où Internet est né. Quelques options dignes de réflexion:
.htaccess
pour essayer: Blocage des navigateurs hors ligne et BadBots , ou Refuser les visiteurs par adresse IP . Cela pourrait les retenir un petit moment.Techniquement, vous ne pouvez pas empêcher cette action.
Cependant, vous pouvez faire des choses pour "désamorcer" les pages en double ou de mauvaise qualité qui peuvent nuire à votre classement.
body
et à l'intérieur de la section du contenu principal.