J'héberge mon site Web sur Azure et j'ai récemment activé une fonctionnalité pour pouvoir accéder directement à chaque instance de serveur de notre batterie de serveurs Web par un numéro de port. Par exemple, http://example.com:10015
et http://example.com:10016
.
Je suis un peu inquiet du contenu dupliqué dans Google et je ne veux pas que Google détecte ces URL d'une manière ou d'une autre et commence à les indexer. J'ai récemment eu ce problème avec les domaines cloudapp.net
par défaut d'Azure et j'ai maintenant ajouté un 301 pour ce domaine ainsi qu'un robots.txt réécrire, de sorte que je n'autorise pas les robots pour ce domaine.
Je voulais utiliser une règle robots.txt de réécriture pour le port différent s mais cela ne semble pas fonctionner pour une raison quelconque. Je ne sais pas si cela a à voir avec la gestion d'Azure, mais par exemple, la variable SERVER_PORT
renvoie le port 80
même si je l'utilise pour le port 10015
.
Quoi qu'il en soit, j'essayais simplement d'ajouter mon site avec une spécification de port dans Google Webmaster Tools, mais cela n'a pas fonctionné. En gros, ma question est la suivante: si je dois m'inquiéter du tout, Google traite-t-il même différents ports comme des sites différents?
Google traite-t-il même des ports différents comme des sites différents?
Oui. Google peut et fait indexer des URL avec des ports non standard, comme relayé ici par Matt Cutts de Google, et également confirmé dans un commentaire de cette réponse ici sur notre site par John de Google Mueller: Yep, we can index sites on IP addresses and/or on non-standard ports
.
Je suis un peu inquiet du contenu dupliqué dans Google
Si ces différentes URL renvoient le même contenu, vous pouvez alors indiquer à Google quelle est la RL préférée pour votre conten à indexer à l'aide d'un lien canonique . Comme indiqué par Google:
To address these issues, we recommend you define a canonical URL for content (or equivalent content) available through multiple URLs.