Lorsque je recherche site:[example].com
dans Google pour mon blog, la majorité des pages indexées sont de "jolis liens" vers des sites externes.
J'ai créé ces liens à l'aide du plugin Pretty Links afin que je puisse rendre les liens vers des sites externes plus agréables et propres, et aussi pour pouvoir suivre le nombre de personnes qui consultent ces sites à partir de mon blog.
Mais beaucoup d'entre eux ont été créés avant que je comprenne quoi que ce soit à propos des liens suivre/ne pas suivre. En apprenant plus, j'ai réalisé que ce n'était pas idéal et j'ai changé chacun de ces liens en "aucun suivi", mais cela n'a pas empêché d'être indexé par Google.
Comment puis-je empêcher ces liens d'être indexés?
Google n'indexe pas les liens, il indexe les pages.
Il semble que les pages pointées vers ces jolis liens, comme example.org/clickout/5
, ne disposent pas d'un paramètre de robot ou d'un code de statut http permettant à Google de savoir que vous ne souhaitez pas que ces pages figurent dans l'index.
Avez-vous essayé le suivant?
noindex
aux pages de clic intermédiaires? Cela empêchera Google d’indexer les pages de cliché intermédiaires.[Modifier] Suppression de la suggestion de bloquer les URL intermédiaires dans le fichier robots.txt, ajout de la suggestion de vérification du code de statut http.
Ajouter
<meta name="robots" content="noindex,nofollow"/>
<meta name="googlebot" content="noindex,nofollow,noarchive,unavailable_after:[date]"/>
au head
des pages que vous souhaitez exclure de la recherche Google, où [date] doit être une date antérieure à indiquer à Googlebot que la page ne devrait plus être disponible pour le moment.