Il existe donc un type qui duplique mon site http://bitlucid.com d'une manière non standard et pour des raisons néfastes. Je l'ai découvert pour la première fois quand j'ai vu une URL de "copie" dans les journaux de "explorebuncombe.com", et j'ai ouvert cette URL pour trouver exactement mon site.
Nous pouvons voir ici quelques-uns des (nombreux autres) domaines de copie: http://www.copyscape.com/?q=http%3A%2F%2Fbitlucid.com
Je pense que je peux simplement frapper une balise canonique sur mon site et que cela ne devrait être que mon avantage, mais je veux être sûr de pouvoir lutter contre cette approche pour les autres domaines que j'organise moi-même ou pour les autres. Je ne m'inquiète pas de la copie de contenu, mais de la possibilité d'affecter mon classement dans Google et de la liaison dynamique de contenu. J'ai mis une balise canonique sur la source du site. Comment puis-je empêcher la mise en proxy directe des ressources si tel est le cas (par exemple via nginx ou Apache)?
Oui. Vous avez un problème.
Explorebuncombe.com: est un site dédié aux événements et ne semble pas en avoir une copie, mais peut-être dans le passé. Qui sait? Ce n'est pas lié aux deux sites suivants.
Exploredare.com: est une copie de votre site sans redirection de frame ou 301. L'adresse IP est 50.56.48.239 qui se trouve sur un bloc d'adresses IP de Rackspace.
Exploregastonia.com: Copie de votre site également. Je n'ai pas vérifié s'il y avait un cadre ou une redirection - je doute plutôt que ces techniques soient utilisées. L'adresse IP est 50.56.48.239 qui se trouve sur un bloc d'adresses IP de Rackspace.
Les deux sites sont hébergés sur Secureserver.net. Secureserver.net a l'adresse IP 97.74.104.222 qui se trouve sur un bloc d'adresse IP de GoDaddy.com.
Secureserver.net n'a pas de page d'accueil et génère une erreur 404, peu importe la façon dont vous y accédez.
L'enregistrement pour Secureserver.net se trouve sous domaincontrol.com, qui passe à 127.0.0.1 et n'a pas de site www; toutefois, il s'agit du produit de GoDaddy.
Cela signifie qu'Exploredare.com et Exploregastonia.com ainsi que Secureserver.net sont enregistrés via GoDaddy.
Ajouter une étiquette canonique revient à fermer la porte après que le cheval a quitté l'écurie. Je le recommanderais. Mais trop tard pour ce problème.
Vous avez un avis de licence au bas de votre site. Je suggère de l'enlever immédiatement. Vous avez peut-être autorisé des personnes à copier votre site. Voici la licence que vous avez concédée: http://creativecommons.org/publicdomain/zero/1.0/ Je ne dirais pas que cette licence n'a jamais existé, ils se trouvent sur les copies du site.
Le problème, c’est qu’il ya du contenu en double sur le Web et que vos prouesses en matière de recherche ont été sapées.
Je suggère:
1] Changer votre site de manière significative avec la balise canonique sur chaque page. Cela inclut le contenu, les modèles, etc. Assurez-vous que votre nouveau site surpasse l'ancien site du point de vue du référencement. Nous pouvons aider avec une partie de cela ici.
2] Remplir immédiatement une plainte DMCA (Digital Millennium Copyright Act) avec Google - les informations trouvées ici: https://support.google.com/legal/answer/1120734 Si cette page ne vous aide pas, allez ici: https://www.google.com/webmasters/tools/dmca-dashboard Vous aurez besoin d'un compte Google Webmaster Tools.
3] Appelez GoDaddy (480) 505-8877 et expliquez-lui ce qui se passe. Utilisez cette page si vous en avez besoin. Ils devraient désactiver le site Web et envoyer un e-mail au propriétaire du site immédiatement après votre plainte. De même, vous pouvez avoir légalement le droit d'accéder aux informations de contact du propriétaire du site, y compris le nom, l'adresse et le numéro de téléphone de vos archives légales. Vous devrez peut-être parler à un superviseur. S'ils refusent les informations de contact, vous devrez peut-être faire appel à un avocat pour écrire une lettre à leur service juridique. Je mentionnerais votre intention de faire appel à un avocat, même si vous ne le faites pas au bout du compte.
4] Appelez RackSpace 1 (800) 961-4454 et expliquez ce qui se passe. Utilisez cette page si vous en avez besoin. Ils devraient fermer ces sites immédiatement après votre plainte. De même, vous pouvez avoir légalement le droit d'accéder aux informations de contact du propriétaire du site, y compris le nom, l'adresse et le numéro de téléphone de vos archives légales. Vous devrez peut-être parler à un superviseur. S'ils refusent les informations de contact, vous devrez peut-être faire appel à un avocat pour écrire une lettre à leur service juridique. Je mentionnerais votre intention de faire appel à un avocat, même si vous ne le faites pas au bout du compte.
Il semble y avoir beaucoup de cela ces jours-ci. Je ne sais pas quel est le gain. Quel est le site à gagner en copiant votre site? Rien.
Hmm voyez-vous le paradoxe ici? Vous demandez de fermer un site qui vous a grattés sous DMCA, mais vous avez dit qu'ils sont autorisés. Je ne pense pas que vous allez aller trop loin dans la bataille pour les faire taire. Voici le contenu de votre licence qui est [encore] sur le pied de page au 13 mars 2015:
La personne qui a associé une œuvre à cet acte a dédié l’œuvre au domaine public en renonçant à tous ses droits sur l’œuvre dans le monde entier en vertu du droit d’auteur, y compris tous les droits connexes et voisins, dans les limites autorisées par la loi.
Vous pouvez copier, modifier, distribuer et exécuter le travail, même à des fins commerciales, sans demander la permission. Voir Autres informations ci-dessous.
Donc, j'ai ouvert un racleur aussi, son therealroyronalds.com si vous voulez vérifier! Je plaisante ... certaines choses que vous pouvez essayer:
Supprimez cette licence puis soumettez votre réclamation à le rapport de scraper Google puis désavouez leurs domaines dans les outils Google pour les webmasters. Aussi, vous devriez les signaler en tant que phisher car ils se font passer pour vous. Créez un atterrisseur sur votre site expliquant ce qui s'est passé et veillez à utiliser des mots clés en utilisant leurs domaines. Cela garantira que vous obtiendrez des résultats une fois qu'ils auront disparu. Aussi à bord des personnes qui ont peut-être été phishing par eux.
S'ils utilisent un extrait d'origine (tel que file_get_contents ou CURL), modifiez le site entier, servez evil.js avec evil.css avec des images de beastiality désagréables lorsque les requêtes proviennent de leur domaine (s) ou de l'adresse IP du serveur. Heck, vous pouvez même dissimuler des mots de spam épouvantables pour qu'ils soient mis à l'abri des résultats. Faites preuve de créativité ... peut-être un discours sur combien ils détestent Google et leur faire appeler Cutts, Mueller, Grigorik, & Far très mauvais noms. Pour ce faire, vous pouvez analyser les en-têtes de demande afin de réécrire la réponse et/ou utiliser HTACCESS de manière similaire au fonctionnement de la prévention de la liaison dynamique.
Si CNAME masque votre site, c'est un peu différent. Dans ce cas, il n’existe pas d’origine-pull, mais vous pouvez toujours récupérer la demande et rediriger (en préservant l’URI) vers votre domaine. Donc, s'ils venaient sur www.exploredare.com/me
, il serait 301 à bitlucid.com/me
. ou peut-être pourriez-vous les diriger vers un type d'atterrisseur bitlucid.com/you-came-from-a-scraper
.
Si des données sont extraites d’utils et de choses telles que JSON [P], vous pouvez utiliser CORS pour limiter les domaines autorisés à utiliser les actifs. Si cela n’est pas réalisable, utilisez la même tactique: fournir des données sur les appâts plutôt que des réponses réelles lorsque les demandes proviennent de l’un de ces problèmes/domaines. Faites de même pour les sitemaps, les flux, les flux RSS ou toute autre chose. Vous pouvez les remplir avec des liens [porn] aléatoires ou autre chose ... leurs applications vont probablement toujours extraire et afficher les données.
Vous devez utiliser un protocole SSL et appeler explicitement toutes les ressources HTTPS. Cela briserait la plupart de leurs sites et aiderait un peu à vous distinguer des néfastes. Assurez-vous de définir HSTS, CST et d'autres indicateurs de sécurité plus élevés pour qu'il réitère le fait que vous êtes vous-même. Si vous avez l'argent, procurez-vous le certificat de qualité supérieure fourni avec la grande "barre d'identité" verte. Il est hautement douteux qu’ils obtiennent un certificat de haut niveau (ou un certificat du tout), et s’il s’agit d’un racleur, cela signifie qu’ils devront passer et changer tous les codes src en http à chaque fois.
Ce que vous devriez faire est de mettre à jour votre site Web tout de suite et d’ajouter une sorte d’horodatage à la vue de tous. Par exemple:
Website updated on: MM-DD-YYYY
Ensuite, rendez les liens (surtout les images) plus absolus. Donc, au lieu de liens comme:
abc.html
image1.jpg
Utilisez des liens comme:
http://www.example.com/abc.html
http://www.example.com/image1.jpg
Une fois que cela est fait, installez un module de limitation qui limite les requêtes afin que les futurs "script kiddies" ne ramassent pas le contenu de votre site aussi facilement.
En outre, ajoutez une section de termes et conditions et faites-la indexer avec Google pour indiquer clairement aux internautes que vous avez créé votre site.
Si cela continue, vous pouvez essayer de déposer une plainte contre l'entreprise qui possède l'adresse IP qui copie votre contenu à l'adresse suivante:
www.dmca.com
OR
vous pouvez faire une recherche whois sur l'IP et envoyer un email à l'adresse email du service des abus qui apparaît dans l'enregistrement whois.