Je suis sur le point d'activer CDN sur l'un de mes nouveaux sites et je souhaite éviter tout problème de contenu/classement en double. Par défaut, les URL WP _ du CDN du moteur sont configurées de la manière suivante:
Cette URL:
http://domain.com/wp-content/uploads/image.jpg
Deviendra:
http://cdnzonename.wpengine.netdna-cdn.com/wp-content/uploads/image.jpg
Tant qu'ils maintiennent les chemins dans le bon ordre, le domaine ne m'appartient pas.
Mon plan est de changer l’enregistrement CNAME et de pointer la longue URL CDN vers quelque chose comme http: /cdn.domain.com.
Existe-t-il d'autres complications CDN liées au référencement dont je devrais être au courant?
En bref:
En utilisant un CDN, vous effectuez des copies identiques de votre contenu sur le réseau. Bien qu'un CNAME avec le même domaine (mais avec un sous-domaine différent de celui de cdn.domain.tld) aide certainement et ne provoquera probablement pas de problèmes de contenu en double.
n bon moyen d'éviter les problèmes de contenu en double consiste à utiliser la balise "rel canonical".
Ce faisant, les deux URL servent exactement le même contenu et ont donc la même balise rel canonique en place, les deux pointant vers la version de votre domaine principal.
Exemple:
domain.com/content/page1 -> rel-canonical to -> domain.com/content/page1
cdn.domain.com/content/page1 -> rel-canonical to -> domain.com/content/page1
Le contenu dupliqué généré par les CDN peut être adressé de deux manières différentes selon la configuration de votre CDN:
Robots.txt: L'ajout d'un fichier robots.txt à votre CDN-URL indiquera au webcrawler si cette URL doit être indexée ou non. Voici un exemple de fichier robots.txt simple:
User-agent: *
Disallow: /
Ajouter un en-tête HTTP canonique à un actif indiquera que cet actif du CDN n’est qu’une copie. Le CDN doit offrir cette fonctionnalité pour ajouter les en-têtes canoniques. Voici un exemple d'actif chargé à partir d'un CDN (y compris l'en-tête canonique ->):
curl -I https://cdn.keycdn.com/img/logo.svg
HTTP/1.1 200 OK
Server: keycdn-engine
Date: Wed, 03 Feb 2016 19:52:18 GMT
Content-Type: image/svg+xml
Content-Length: 12557
Connection: keep-alive
Vary: Accept-Encoding
Last-Modified: Sat, 02 May 2015 07:59:30 GMT
ETag: "554483e2-310d"
Expires: Wed, 10 Feb 2016 19:52:18 GMT
Cache-Control: max-age=604800
Strict-Transport-Security: max-age=31536000; includeSubdomains; preload
Link: <https://www.keycdn.com/img/logo.svg>; rel="canonical"
X-Cache: HIT
X-Edge-Location: nlam
Access-Control-Allow-Origin: *
Accept-Ranges: bytes