Quelqu'un a cloné mon blog WordPress, comment puis-je l'empêcher de nuire au référencement?

Question

Mon blog WordPress est complètement cloné. Ce site clone est mis à jour en temps réel avec mon blog. Je suis surpris que quelqu'un puisse réellement le faire.

Que dois-je faire pour limiter les conséquences néfastes du classement de mon moteur de recherche? Existe-t-il un moyen de dire à Google de ne pas indexer ce site?

John Conde · Answer

Ils chargent simplement votre site via un script côté serveur. Tout ce que vous avez à faire est de bloquer l'adresse IP de leur serveur via .htaccess. Ouvrez simplement les journaux d'accès de votre serveur, ouvrez la page clonée sur son site, puis consultez votre journal pour la nouvelle entrée et vous obtiendrez leur adresse IP.

Il ne serait également pas préjudiciable de soumettre une demande DMCA à Google également, mais cela ne sera pas vraiment nécessaire car ce contenu disparaîtra instantanément une fois que vous aurez bloqué leur adresse IP.

MrWhite · Answer

(En plus de la réponse de @ John.)

Existe-t-il un moyen de dire à Google de ne pas indexer ce site?

Plutôt curieux que , ils semblent avoir tout cloné tout (y compris votre code XML plans du site^{* 1}), ils n'ont pas cloné votre fichier robots.txt. En fait, le fichier robots.txt sur de ce site bloque activement l’exploration de tout! Il ne semble donc y avoir rien à faire à cet égard. Effectuer une recherche de site sur ce domaine ne renvoie que le domaine nu et une notification indiquant qu'il est bloqué par le fichier robots.txt.

(Plutôt curieux de savoir quelle serait leur intention en faisant cela? Vous pourriez peut-être simplement supposer qu'ils ont commis une erreur avec robots.txt - et peut-être que oui - mais cela ressemble plus à une exception délibérée pour moi?)

~~De plus, même si vos sitemaps XML sont clonés, ils ne mettent pas à jour leurs URL (comme ils le font sur les pages du site principal), ils pointent donc toujours vers votre site.~~

^{* 1} En ce qui concerne les sitemap XML. Sur votre site, "sitemap.xml" correspond en fait à une redirection vers "sitemap_index.xml" et le site cloné a en fait cloné la redirection ... qui redirige vers votre site! (Sûrement une erreur de leur part.) "Sitemap_index.xml" est simplement un index, qui renvoie à 4 autres sitemaps. Si l'une de ces sitemaps est demandée directement sur le site cloné, elle est correctement clonée et les URL sont mises à jour. Cependant, j'aurais dit qu'il était peu probable que ces sitemaps soient trouvés sur le site cloné en raison de la redirection initiale de "sitemap.xml". (?) Bien que s'ils soumettaient "sitemap_index.xml" directement, ils contourneraient évidemment la redirection.

John · Answer

Si le site génère des liens retour vers vous, il est important d'utiliser l'outil Google Désactiver, sinon l'algorithme fonctionnera contre vous, peu importe.

https://www.google.com/webmasters/tools/disavow-links-main

créez un fichier .txt et ajoutez:

domain:thedamnsitethatcloned.com

puis le télécharger sur Google via les Outils pour les webmasters.

Voici exactement les étapes que je prendrais pour résoudre ce problème. Je sais que beaucoup de webmasters sont confrontés à ce problème. J'ai déjà eu ce problème auparavant et il ne semble pas y avoir de réponse directe sur Google (ironiquement) (c'est pourquoi je veux aider). Matt Cutts est le mec que vous êtes censé écouter à propos de ces problèmes, mais l’écouter, c’est comme tenter de gagner une partie d’échecs contre un supercalculateur dans une maison en flammes (aucune aide à trouver).

Les coupures courtes:

Inscrivez-vous auprès de DMCA et mettez le badge sur votre site web.
Rassemblez tout le contenu copié en collant dans Google les 60 premiers mots de votre site Web et en les joignant VIA https://www.google.com/webmasters/tools/dmca-dashboard Demandes DMCA n'acceptera que les permaliens.
Désavouez CHAQUE site qui a copié le contenu qui vous renvoie. Faites cela sur chaque page de votre site web.

Ma première réponse a été de désavouer le domaine, mais j'ai oublié de mentionner que vous devez désavouer:

www. ET
non www.

(Google les compte comme deux domaines distincts).