Selon mes recherches, les anciennes méthodes de consolidation des URL paginées en une seule ne sont plus recommandées.
Vieilles manières:
Utilisation de rel=prev/next
, mais:
"Rel = prev/next n'est plus un signal d'indexation" ( Google WebmasterBlog )
Utilisation de noindex,follow
sur les pages paginées , mais:
"Si nous voyons le noindex plus longtemps que nous le pensons, cette page ne veut vraiment pas être utilisée dans la recherche, nous la supprimerons donc complètement. Et puis nous ne suivrons pas les liens de toute façon. essentiellement un peu comme un noindex, nofollow. " - John Mueller
Cela signifie que ces pages ne distribueront pas le PageRank et seront peut-être même exclues de l'exploration, ce qui entraînera la non-découverte de nouveaux liens sur ces pages.
Utilisation de rel = canonical pour la première page , mais:
"Googlebot n'indexera alors pas les pages qui apparaissent plus loin dans la chaîne, ni ne reconnaîtra les signaux vers le contenu lié à partir de ces pages" SearchEngineJournal
Cela ressemble au noindex,nofollow
problème, voir ci-dessus.
Utilisation d'une page "Afficher tout" , mais:
Ce n'est pas une solution applicable pour les pages plus grandes, ce qui aurait pour dire des milliers de liens à afficher, pour des raisons de performances.
Il semble donc que la seule méthode pour les grands ensembles de résultats soit de ne rien faire, sauf de donner des indices au GoogleBot, par exemple.
rel=prev/next
, parce que ça ne fera pas mal.page=2
pour une reconnaissance facile.Shoes - Page 2
Problème:
Si un domaine a 1000 catégories dont chacune a 20 pages, cela donne 20000 URL indexées, au lieu de 1000 si nous utilisions les anciennes méthodes. Autrefois, cela était considéré comme mauvais.
Existe-t-il un consensus sur la façon de procéder de nos jours? Parce que j'ai vu des domaines très performants ne pas adapter ces nouveaux développements et s'en tenir aux anciennes méthodes.
J'envisagerais de supprimer complètement la pagination:
Il existe de meilleures façons de gérer les grands catalogues de produits pour les moteurs de recherche et pour les utilisateurs. La pagination n'est pas nécessaire sur un site moderne.
Si vous implémentez la pagination (et vous le ferez probablement parce qu'il est si facile à programmer), je suggérerais:
/pages/
pour pouvoir utiliser Disallow: /pages
. La pagination ne transmet pas efficacement le jus de lien, donc cela ne nuira pas au classement des pages de produits pour ce faire. Cela empêchera la découverte de nouvelles pages de produits détaillées. Vous avez donc absolument besoin d'autres liens dans chaque page de produit à partir d'autres pages de produit avant de le faire.noindex
à la page 2+ pour empêcher les moteurs de recherche d'indexer les pages de faible qualité. Si vous ne pouvez pas empêcher l'exploration des pages, au moins empêchez-les d'être indexées.Comme vous l'avez noté, rel=prev/next
n'est pas utilisé par Google. Vous pouvez l'utiliser si vous le souhaitez, mais cela ne changera rien.
rel=noindex,follow
finit par être le même et rel=noindex,nofollow
pour Google, car Google ne transmet pas le jus de liens aux pages qui ne figurent pas dans son index. Comme je l'ai noté, cela n'a pas vraiment d'importance de toute façon. La page 3 n'a presque pas de jus de lien disponible pour passer.
rel=canonical
à la première page ne fonctionnera plus. De nos jours, Google ignore le signal canonique si le contenu ne semble pas être presque en double. Étant donné que les produits répertoriés sont différents, Google est susceptible d'ignorer tous les signaux canoniques entre les pages paginées.
Google Pagerank (PR) était auparavant mesuré à l'aide de la barre d'outils Google sur une échelle logarithmique de 0 à 10. En général, je dirais que vous avez besoin du PageRank (tPR) de 1 de la barre d'outils pour être indexé et de 2 pour se classer en termes de queue compétitifs. Pour faciliter les calculs de RP, je travaille généralement en unités de jus de liaison linéaire (LLJ).
Lorsque je dis que la pagination ne dépasse pas le PageRank au-delà de la page 2, je suppose que chaque page de la pagination n'est liée qu'à la page suivante. Dans ce cas, il est très facile de voir ce qui se passe. Disons que votre page de catégorie de page 1 a un tPR de 3. Il y aurait 1000 unités de LLJ, dont 900 sont disponibles pour passer (en raison du facteur d'amortissement du PageRank). Dans le cas où il y a exactement 21 liens sur votre page 1 (20 vers les produits et un vers la page 2), alors chacune de ces autres pages a un LLJ de 43 ou un tPR de 1.6. Assez pour être indexé et se classer décemment bien.
La page 2 a 43 LLJ à passer. Chaque page vers laquelle il renvoie ne reçoit que 1,8 LLJ ou 0,3 tPR. Probablement pas suffisant pour indexer les pages produits. Certainement pas assez de PageRank pour la page 3 pour transmettre quoi que ce soit de significatif du tout.
Lorsque vous introduisez 10 liens de pagination sur chaque page, cela rend les calculs beaucoup plus difficiles car il y a des boucles de rétroaction dans le calcul. Vous devez créer un graphique de liens et calculer le flux sur plusieurs itérations à travers celui-ci. Vous vous retrouvez dans une situation similaire. Vous avez 20 produits qui obtiennent une quantité décente de PageRank à partir de la page 1. Les pages de pagination 2 à 11 obtiennent des quantités similaires de PageRank et vous pourriez être en mesure d'obtenir les 200 produits auxquels ils sont liés à indexés. Au-delà de la page 10, elle est similaire à la page 3 dans le modèle à lien unique.
En fin de compte, le calcul des RP est principalement un exercice académique. D'autres facteurs tels que ce que Google identifie comme de faible qualité finissent par jouer de grands rôles. Google choisira probablement de ne pas indexer vos pages paginées, car elles ne font pas de bonnes pages de destination. D'après mon expérience, il semble que Google traite les pages non indexées de la même manière que si elles avaient noindex
meta tags. En d'autres termes, même si vous pouvez leur transmettre des RP, peu importe si Google ne veut pas les indexer. Cela ne finira pas par leur faire passer le PageRank.