web-dev-qa-db-fra.com

Quel est le consensus sur la gestion de la pagination en 2019 sur les grands ensembles de résultats?

Selon mes recherches, les anciennes méthodes de consolidation des URL paginées en une seule ne sont plus recommandées.

Vieilles manières:

Utilisation de rel=prev/next, mais:

"Rel = prev/next n'est plus un signal d'indexation" ( Google WebmasterBlog )

Utilisation de noindex,follow sur les pages paginées , mais:

"Si nous voyons le noindex plus longtemps que nous le pensons, cette page ne veut vraiment pas être utilisée dans la recherche, nous la supprimerons donc complètement. Et puis nous ne suivrons pas les liens de toute façon. essentiellement un peu comme un noindex, nofollow. " - John Mueller

Cela signifie que ces pages ne distribueront pas le PageRank et seront peut-être même exclues de l'exploration, ce qui entraînera la non-découverte de nouveaux liens sur ces pages.

Utilisation de rel = canonical pour la première page , mais:

"Googlebot n'indexera alors pas les pages qui apparaissent plus loin dans la chaîne, ni ne reconnaîtra les signaux vers le contenu lié à partir de ces pages" SearchEngineJournal

Cela ressemble au noindex,nofollow problème, voir ci-dessus.

Utilisation d'une page "Afficher tout" , mais:

Ce n'est pas une solution applicable pour les pages plus grandes, ce qui aurait pour dire des milliers de liens à afficher, pour des raisons de performances.


Il semble donc que la seule méthode pour les grands ensembles de résultats soit de ne rien faire, sauf de donner des indices au GoogleBot, par exemple.

  • En utilisant rel=prev/next, parce que ça ne fera pas mal.
  • Utilisez des paramètres d'URL standard comme page=2 pour une reconnaissance facile.
  • Utilisez des indices dans le titre pour signaler la pagination, par exemple Shoes - Page 2
  • Priez pour que tout se passe bien.

Problème:

Si un domaine a 1000 catégories dont chacune a 20 pages, cela donne 20000 URL indexées, au lieu de 1000 si nous utilisions les anciennes méthodes. Autrefois, cela était considéré comme mauvais.

Existe-t-il un consensus sur la façon de procéder de nos jours? Parce que j'ai vu des domaines très performants ne pas adapter ces nouveaux développements et s'en tenir aux anciennes méthodes.

7
rapstacke

J'envisagerais de supprimer complètement la pagination:

  • Ce n'est pas bon pour les moteurs de recherche.
    • Il ne transmet pas le jus de lien au-delà de la page 2.
    • Il crée des tonnes de pages supplémentaires de faible qualité.
  • Ce n'est pas bon pour les utilisateurs.
    • Seul un petit pourcentage d'utilisateurs (moins de 5%) utilise la pagination
    • Parmi les utilisateurs qui utilisent la pagination, aucun n'obtient plus de quelques pages

Il existe de meilleures façons de gérer les grands catalogues de produits pour les moteurs de recherche et pour les utilisateurs. La pagination n'est pas nécessaire sur un site moderne.

Que devez-vous faire au lieu de la pagination?

  1. Avoir plus de produits sur une page 1 que les utilisateurs n'en auront probablement besoin. Je suggère d'énumérer 100 produits sur la page de catégorie.
  2. Implémentez un défilement infini. Le défilement infini est plus facile pour les utilisateurs que la pagination. Il ne crée pas de pages de mauvaise qualité pour les moteurs de recherche.
  3. Fournir une recherche sur le site. Les utilisateurs préfèrent rechercher plutôt que parcourir des listes interminables.
  4. Implémentez la navigation à facettes. Les utilisateurs aiment pouvoir accéder aux produits en fonction d'attributs tels que "moins de 100 $", "avec fonctionnalité X" ou "4 étoiles et plus". Vous pouvez laisser les moteurs de recherche explorer des pages à facettes qui ont exactement un attribut sélectionné.
  5. Trouvez d'autres façons de créer un lien vers chaque page de produit. Il est de loin préférable pour les moteurs de recherche que les pages de produits soient liées les unes aux autres. De nombreux sites utilisent des sections "produits connexes", "les clients qui ont acheté ce produit ont également acheté" et "produits en vedette" sur les pages de produits pour mettre en évidence d'autres produits. Cela peut être utile pour les utilisateurs, mais c'est souvent principalement pour les moteurs de recherche. C'est pourquoi ce site a la section des questions "connexes" sur la gauche.

Si vous implémentez la pagination (et vous le ferez probablement parce qu'il est si facile à programmer), je suggérerais:

  • Premier choix: Empêchez même les robots d'explorer la page 2+ en les répertoriant dans robots.txt. Cela peut signifier l'utilisation d'un préfixe distinct pour les pages 2+, comme le démarrage de ces URL avec /pages/ pour pouvoir utiliser Disallow: /pages. La pagination ne transmet pas efficacement le jus de lien, donc cela ne nuira pas au classement des pages de produits pour ce faire. Cela empêchera la découverte de nouvelles pages de produits détaillées. Vous avez donc absolument besoin d'autres liens dans chaque page de produit à partir d'autres pages de produit avant de le faire.
  • Deuxième choix: utilisez noindex à la page 2+ pour empêcher les moteurs de recherche d'indexer les pages de faible qualité. Si vous ne pouvez pas empêcher l'exploration des pages, au moins empêchez-les d'être indexées.
  • Troisième choix: laissez les moteurs de recherche explorer et indexer toutes les pages. Si vous n'implémentez pas d'autres liens vers chaque page de produit, j'irais avec celui-ci. Cela ne nuira pas vraiment à votre référencement. Il permettra aux moteurs de recherche de découvrir tout votre contenu. Google remarquera probablement que les pages de pagination sont de mauvaise qualité et choisira de ne pas les indexer de toute façon. Alors que les moteurs de recherche découvriront toutes vos pages de produits, la plupart d'entre eux n'auront pas assez de jus de liens pour être indexés par la pagination uniquement. Attendez-vous surtout à ce que ceux répertoriés aux pages 1 et 2 soient indexés. Parmi ceux au-delà de la page 1, ils ne se classeront pas bien même s'ils sont indexés jusqu'à ce que vous trouviez un moyen d'obtenir d'autres liens de votre site vers ces pages.

Comme vous l'avez noté, rel=prev/next n'est pas utilisé par Google. Vous pouvez l'utiliser si vous le souhaitez, mais cela ne changera rien.

rel=noindex,follow finit par être le même et rel=noindex,nofollow pour Google, car Google ne transmet pas le jus de liens aux pages qui ne figurent pas dans son index. Comme je l'ai noté, cela n'a pas vraiment d'importance de toute façon. La page 3 n'a presque pas de jus de lien disponible pour passer.

rel=canonical à la première page ne fonctionnera plus. De nos jours, Google ignore le signal canonique si le contenu ne semble pas être presque en double. Étant donné que les produits répertoriés sont différents, Google est susceptible d'ignorer tous les signaux canoniques entre les pages paginées.

En savoir plus sur la pagination et le PageRank

Google Pagerank (PR) était auparavant mesuré à l'aide de la barre d'outils Google sur une échelle logarithmique de 0 à 10. En général, je dirais que vous avez besoin du PageRank (tPR) de 1 de la barre d'outils pour être indexé et de 2 pour se classer en termes de queue compétitifs. Pour faciliter les calculs de RP, je travaille généralement en unités de jus de liaison linéaire (LLJ).

  • 0 tPR = 1 LLJ
  • 1 tPR = 10 LLJ
  • 2 tPR = 100 LLJ
  • 3 tPR = 1000 LLJ
  • 4 tPR = 10 000 LLJ
  • ...

Lorsque je dis que la pagination ne dépasse pas le PageRank au-delà de la page 2, je suppose que chaque page de la pagination n'est liée qu'à la page suivante. Dans ce cas, il est très facile de voir ce qui se passe. Disons que votre page de catégorie de page 1 a un tPR de 3. Il y aurait 1000 unités de LLJ, dont 900 sont disponibles pour passer (en raison du facteur d'amortissement du PageRank). Dans le cas où il y a exactement 21 liens sur votre page 1 (20 vers les produits et un vers la page 2), alors chacune de ces autres pages a un LLJ de 43 ou un tPR de 1.6. Assez pour être indexé et se classer décemment bien.

La page 2 a 43 LLJ à passer. Chaque page vers laquelle il renvoie ne reçoit que 1,8 LLJ ou 0,3 tPR. Probablement pas suffisant pour indexer les pages produits. Certainement pas assez de PageRank pour la page 3 pour transmettre quoi que ce soit de significatif du tout.

Lorsque vous introduisez 10 liens de pagination sur chaque page, cela rend les calculs beaucoup plus difficiles car il y a des boucles de rétroaction dans le calcul. Vous devez créer un graphique de liens et calculer le flux sur plusieurs itérations à travers celui-ci. Vous vous retrouvez dans une situation similaire. Vous avez 20 produits qui obtiennent une quantité décente de PageRank à partir de la page 1. Les pages de pagination 2 à 11 obtiennent des quantités similaires de PageRank et vous pourriez être en mesure d'obtenir les 200 produits auxquels ils sont liés à indexés. Au-delà de la page 10, elle est similaire à la page 3 dans le modèle à lien unique.

En fin de compte, le calcul des RP est principalement un exercice académique. D'autres facteurs tels que ce que Google identifie comme de faible qualité finissent par jouer de grands rôles. Google choisira probablement de ne pas indexer vos pages paginées, car elles ne font pas de bonnes pages de destination. D'après mon expérience, il semble que Google traite les pages non indexées de la même manière que si elles avaient noindex meta tags. En d'autres termes, même si vous pouvez leur transmettre des RP, peu importe si Google ne veut pas les indexer. Cela ne finira pas par leur faire passer le PageRank.

6