web-dev-qa-db-fra.com

Contenu en double: Empêchez les sites de test et de développement d'être analysés et indexés

J'utilise un site basé sur WordPress sur example.com avec son contenu d'origine.

J'ai ensuite un autre site en cours d'exécution sur example.me, qui est fondamentalement la copie exacte de l'original example.com avec le contenu de tout example.com et j'utilise ceci - example.me uniquement à des fins de test, pour développer et tester de nouveaux plugins et fonctionnalités que je déploie ensuite sur le domaine principal example.com.

J'utilise les paramètres par défaut de WordPress sur example.me, ce qui empêche les robots d'explorer le site, mais WordPress avertit que cela risque de ne pas toujours fonctionner.

Existe-t-il un autre moyen de faire savoir immédiatement à Google que ce site example.me est une copie de example.com et qu'il n'est pas indexé?

Une sorte de balise canonique générale que je pourrais utiliser pour tout le site?

Existe-t-il un paramètre dans les outils pour les webmasters?

2
Joe Bloggs

Les balises canoniques ne sont pas conçues pour fonctionner dans tout le domaine, elles sont conçues pour identifier le lien canonique page par page. Le meilleur moyen est d'utiliser un fichier robots.txt contenant les éléments suivants ...

User-agent: *
Disallow: /

Ce fichier robots.txt indique aux robots d'exploration de ne pas analyser ou indexer le site. Qu'il soit respecté ou non par un robot, ce fichier leur appartient et ne peut donc pas être utilisé pour empêcher l'accès des robots pour des raisons de sécurité; toutefois, le but que vous avez mentionné étant donné que le site contient beaucoup de doublons et est conçu comme un outil de développement. environnement de test, cela fonctionnera et empêchera le site d’être indexé et analysé par Google pour des raisons d’indexation.

1
Chris Rutherfurd