web-dev-qa-db-fra.com

Comment interdire à Google d'explorer mon site Web à l'aide d'images?

Je m'occupe d'un site Web qui contient plusieurs images provenant de liens extérieurs.

Le fait est que ces liens sont des liens sortants et je veux éviter cela autant que possible.

J'ai trouvé une solution qui consistait à ajouter rel="nofollow" à mes liens, mais le problème, c'est que le W3C est explicite à ce sujet: ce n'est pas autorisé.

Ma première question est donc la suivante: comment Google réagirait-il?

La deuxième pensée que je me suis demandé: puis-je dire à Google via robots.txt de ne pas aller plus loin? Si oui, comment suis-je censé le faire?

J'ai lu que l'expression rationnelle n'est pas autorisée dans le fichier robots.txt et que je ne peux pas utiliser quelque chose comme Disallow: /*.jpg$, car j'ai besoin d'analyser certaines de mes images.

Modifier:

Je viens de penser à ceci:

User-agent: *    
Allow: /images/*.jpg$
Disallow: /*.jpg$

Depuis toutes nos images personnelles sont situées dans un dossier spécifique. Cela fonctionnerait-il?

3
Baldráni

Vous avez raison, rel=nofollow est uniquement destiné aux liens. La balise <img> ne peut pas avoir d'attribut rel = nofollow.

Que veux-tu dire par

interdire à Google de sortir de mon site Web à travers des images?

Google Bot ne rampe pas lorsqu'il rencontre une image externe. Cela donne simplement une reconnaissance positive (ou parfois négative) et peut l'indexer - Google ne peut pas explorer une image. Votre site Web sera analysé tel quel avec ou sans liens externes.

Ce que rel=nofollow dit (dans le cas d’un lien externe) Google, c’est que vous ne recommandez pas de manière positive le site Web, vous vous contentez de fournir un lien. Même avoir des liens externes sans nofollow n'affecte pas l'exploration de votre site Web.

Je ne suis pas sûr s'il existe un attribut correspondant similaire à nofollow pour les images et c'est à juste titre parce que les images ne peuvent être indexées et non explorées/suivies. Que ce soit pour autoriser ou non l’indexation d’une image revient au propriétaire de l’image (le site Web externe), qui peut autoriser/interdire l’indexation des images par le biais de robots.txt, mais ce n’est pas votre décision.

User-agent: Googlebot-Image
Disallow: / 
4
Aakash