web-dev-qa-db-fra.com

Remplacement de l'utilisation de l'outil de paramètres d'URL par canonical / robots.txt pour éviter le temps d'analyse

Je reçois depuis longtemps Googlebot found an extremely high number of URLs des avertissements, qui, à mon avis, n'indiquent pas nécessairement l'existence d'un problème, mais j'essaie de réduire le nombre de liens explorables par Google pour l'aider à se concentrer sur ce qui est plus important.

Je pense modifier les paramètres d'un paramètre d'URL avec un lien canonique. J'ai des paramètres de filtre que j'ai définis comme Narrows et Specifies dans les paramètres d'URL WMT: enter image description here
Ces pages de filtres internes ont de la valeur, mais amener l'utilisateur à la page principale sans aucun filtre est presque suffisant, et je pense que c'est un compromis que je devrais faire étant donné que j'ai trop de pages par rapport à ma réputation, obtenant ainsi ces messages d'avertissement.

Je pense à deux options:

  1. Ajout d'une balise méta-canonique pour les URL avec les paramètres de filtre sélectionnés, à la page sans rétrécissement/spécification de ces filtres.
  2. Ajout du fichier robots.txt pour éviter l'exploration de ces pages. (Cela ne gaspillera pas le temps du robot à essayer de trouver la balise méta canonique, mais jettera le lien actuel qui alimente ces pages dans la corbeille, au lieu de le transmettre à la page sans aucun filtre sélectionné).

Recommanderiez-vous l'un ou l'autre?

1
Noam

Spécifier un canonique sur les pages de filtre à la page parent (non-filtre) convient parfaitement, mais vous pouvez également servir un méta-noindex, nofollow sur ces pages de filtre et indiquer à Google quoi faire avec ces URL de filtre (si elles contiennent des paramètres). ) de la section de Google WMT que vous avez déjà mentionnée. Les désactiver dans le fichier robots.txt est également une autre option, mais ne les supprimera pas de l'index de Google s'ils sont déjà indexés.

L'implémentation de toutes ces options ne présente aucun inconvénient pour garantir que Google analyse, indexe et place uniquement sur les pages principales de votre site Web un contenu que vous souhaitez voir performer et bien classer.

1
zigojacko