D'après votre expérience, avez-vous déjà eu des problèmes de duplication de contenu en raison des URL suivantes:
www.mysite.net
www.mysite.net/
www.mysite.net/index.html
Pensez-vous que cela pourrait entraîner un problème de contenu en double si mon lien canonique pointe constamment uniquement vers ceci: www.mysite.net
Non, pas si leur contenu est identique (ou presque) et qu'ils ont tous un élément de lien canonique référençant www.mysite.net
.
Cependant, ce type de problème survenant au niveau du site peut être considéré comme un problème efficacité de l'analyse et l'élément de lien canonique ne résout pas vraiment cela. Dans votre exemple, un robot de recherche explorera trois pages alors qu’il n’en aurait vraiment besoin que d’en explorer une. Intensifiez-le et ajoutez d'autres problèmes de duplication , et cela devient un problème.
Ainsi, pour ce type de problème (nous pouvons inclure des éléments comme avec/sans le sous-domaine www, avec/sans HTTPS, etc.), il est généralement préférable d’utiliser les réécritures d’URL pour rediriger la redirection vers la forme canonique.
L'élément de lien canonique est l'arme de choix lorsqu'il y a beaucoup de variations dans les duplications que vous gérez, ou que vous ne savez pas à l'avance ce qu'elles seront. Pensez à un site commercial où des dizaines de paramètres de raffinement de catégories de produits peuvent être ajoutés à une URL de base dans n'importe quel ordre, par exemple. Cela ne signifie pas qu'il ne faut pas l'ajouter à moins que vous n'ayez ce genre de problème, mais ne vous fiez pas à cela pour résoudre des problèmes pour lesquels il existe de meilleures solutions.
D'un point de vue technique, seules deux d'entre elles sont en réalité des URL différentes. Les éléments suivants sont toujours les mêmes:
http://www.example.com
http://www.example.com/
La raison en est qu'il est impossible pour votre site de diffuser un contenu différent sur ces deux URL en raison de la définition du protocole HTTP. Lorsqu'une demande est faite à votre serveur, la première ligne ressemble à ceci:
GET / HTTP/1.1
Où la barre oblique est la partie après votre nom de domaine. La spécification HTTP n'autorisant pas que cela soit vide, un navigateur doit donc envoyer une barre oblique lors de l'extraction de http://www.example.com
.
Ceci est en contraste avec
http://www.example.com/path
http://www.example.com/path/
qui pourrait avoir un contenu différent, car ils ont un aspect différent lorsque votre serveur les reçoit.
Étant donné que les clients envoient toujours une barre oblique, je préfère http://www.example.com/
comme URL canonique, car elle correspond le mieux à ce qui se passe réellement sous le capot.
Votre élément canonique doit empêcher les moteurs de recherche d’indexer ou de pénaliser le contenu dupliqué.