Je travaille sur un site Web auquel on accède normalement grâce à un équilibre de charge. Mais nous avons également une URL directe vers chaque serveur.
Dernièrement, Google a commencé à indexer les URL directes sur nos serveurs, ce qui est une mauvaise chose car nous ne souhaitons pas que nos utilisateurs accèdent directement à chaque serveur (si un serveur est arrêté pour maintenance).
Nous avons corrigé les balises de lien canoniques pointant vers l'URL d'équilibre de charge. Tous les liens du fichier sitemap.xml pointent vers l'URL d'équilibrage de la charge. Nous n’avons donc aucune idée de la façon dont Google a mis la main sur les URL directes du serveur.
Pour être encore plus clair: notre charge est foo.com
. Tous les liens sur le site utilisent cette URL. Il en va de même pour les sitemap et canical-tags.
Mais Google indexe toujours foo.server01.webhost.com
et foo.server02.webhost.com
Nous ne pouvons pas ajouter de redirections 301 de foo.server**.webhost.com
à foo.com
pour diverses raisons.
Dois-je vérifier que je possède toutes les URL de la console de recherche Google? Ou suis-je en train de rater d'autres paramètres?
... Dernièrement, Google a commencé à indexer les URL directes sur nos serveurs, ce qui est une mauvaise chose ...
Supprimez la balise de lien contenant rel="canonical"
et placez la balise suivante entre <head>
et </head>
du code HTML:
<meta name="ROBOTS" content="NOINDEX">
Cela indiquera à tous les moteurs de recherche de ne pas indexer la page. Cela devrait fonctionner avec tous les moteurs de recherche car certains pourraient même ne pas comprendre et/ou traiter rel=canonical
. Ensuite, après avoir enregistré les modifications, donnez aux moteurs de recherche quelques heures à quelques semaines pour traiter votre demande.
Il y a plus d'informations ici: http://www.metatags.org/meta_name_robots