web-dev-qa-db-fra.com

Comment puis-je empêcher Google d'indexer de "jolis liens" sur des redirections externes à partir de mon site WordPress?

Lorsque je recherche site:[example].com dans Google pour mon blog, la majorité des pages indexées sont de "jolis liens" vers des sites externes.

J'ai créé ces liens à l'aide du plugin Pretty Links afin que je puisse rendre les liens vers des sites externes plus agréables et propres, et aussi pour pouvoir suivre le nombre de personnes qui consultent ces sites à partir de mon blog.

Mais beaucoup d'entre eux ont été créés avant que je comprenne quoi que ce soit à propos des liens suivre/ne pas suivre. En apprenant plus, j'ai réalisé que ce n'était pas idéal et j'ai changé chacun de ces liens en "aucun suivi", mais cela n'a pas empêché d'être indexé par Google.

Comment puis-je empêcher ces liens d'être indexés?

1
Matilda

Google n'indexe pas les liens, il indexe les pages.

Il semble que les pages pointées vers ces jolis liens, comme example.org/clickout/5, ne disposent pas d'un paramètre de robot ou d'un code de statut http permettant à Google de savoir que vous ne souhaitez pas que ces pages figurent dans l'index.

Avez-vous essayé le suivant?

  • Ajouter un méta-robot noindex aux pages de clic intermédiaires? Cela empêchera Google d’indexer les pages de cliché intermédiaires.
  • Basculer vers des liens externes non esthétiques suivis à l'aide d'événements de clic Javascript (par exemple, à l'aide de Google Analytics?)
  • Utilisez un outil tel que https://httpstatus.io/ pour vérifier les codes d’état http renvoyés par la page intermédiaire. Comme Stephen l'a fait remarquer, s'il s'agit de 301 pages, il est peu probable que ces pages de clic soient indexées elles-mêmes.

[Modifier] Suppression de la suggestion de bloquer les URL intermédiaires dans le fichier robots.txt, ajout de la suggestion de vérification du code de statut http.

1
Theo van der Zee

Ajouter

<meta name="robots" content="noindex,nofollow"/>
<meta name="googlebot" content="noindex,nofollow,noarchive,unavailable_after:[date]"/>

au head des pages que vous souhaitez exclure de la recherche Google, où [date] doit être une date antérieure à indiquer à Googlebot que la page ne devrait plus être disponible pour le moment.

0
Khayri R.R. Woulfe