web-dev-qa-db-fra.com

Pourquoi certaines pages Web ne sont-elles pas incluses dans le cache de Google?

J'utilise la réponse à l'adresse https://stackoverflow.com/a/4560541/170243 pour créer un lien vers les caches Google pour des éléments. Cependant, j'ai essayé de l'utiliser pour http://www.dailymail.co.uk/news/article-2283129/Cameron-bans-Obama-bringing-Michelle-G8-decrees-summit- WAG-free-zone.html (qui a six jours) mais n'a pas réussi à le faire fonctionner.

Lorsque j’ai enquêté en ne regardant que l’en-tête, il est apparu que seule la page racine www.dailymail.co.uk était stockée dans le cache google. Tous les autres articles ne vous permettent pas de voir leurs caches, bien que les autres pages citant cet article - J'aimerais savoir comment cela se passe et s'il existe d'autres caches publiques qui feraient le même travail?

1
Joe

Cette page n'est pas mise en cache par Google car elle inclut la directive NOARCHIVE:

<meta name="robots" content="noodp,noydir,all,noarchive" />

C'est-à-dire que les webmasters de http://dailymail.co.uk demandent à Google de ne pas stocker cette page dans son cache.

Je doute qu'il existe d'autres caches publics incluant cette page, car cela signifiera que le cache ignore la directive NOCACHE.

3
Vidar S. Ramdal