J'ai un problème majeur dans le fait que les e-mails envoyés à nos clients apparaissent dans les résultats de recherche de Google. Pour des raisons de confidentialité, je ne peux pas poster ces liens (car ils risquent de ne pas être indexés ici), mais le format ressemble à quelque chose comme ça
http://www.abc.com/xxhh1213131
où xxhh1213131 est un "jeton" unique qui correspond à chacun de nos destinataires.
Une idée de comment cela pourrait se passer? Nous avons un lien "voir en tant que page Web" dans nos courriels. Cela aurait-il pu arriver du trafic à ces liens?
Si les moteurs de recherche peuvent trouver la page sur laquelle se trouvent ces liens et ne sont pas tenus d'ignorer ces pages, ils les indexeront comme tout autre document Web. <speculation>
Dans votre cas particulier, ils les ont probablement trouvées lorsque l'utilisateur est allé les voir. Le navigateur ou une extension du navigateur a envoyé ces informations à Google, qui a ensuite exploré ces pages .</speculation>
Si vous ne souhaitez pas les indexer et souhaitez les supprimer, vous devez demander aux moteurs de recherche de les bloquer. Il y a plusieurs façons de le faire:
1) Utilisez robots.txt
2) Utiliser les balises META
<meta name="robots" content="noindex, nofollow">
3) Utiliser les en-têtes http
Header set x-robots-tag: noindex
4) Utilisez rel = "nofollow"
<a href="http://www.example.com/sample.html" rel="nofollow">Link to page I don't want indexed</a>
5) Placez le contenu derrière une connexion. Les moteurs de recherche (en général) ne soumettent pas de formulaires et ne créent pas de comptes sur des sites Web.
6) Bloquez les robots de tous les principaux moteurs de recherche à l'aide de .htaccess, mais cela serait fastidieux et sujet aux erreurs s'ils changeaient ce que vous utiliseriez pour les identifier (adresse IP, agent utilisateur, par exemple).