web-dev-qa-db-fra.com

type de lien 'canonique' sur les pages paginées?

J'ai remarqué que Stack Overflow utilise un attribut rel=canonical à la page 2+ des réponses. Par exemple, voir https://stackoverflow.com/questions/6470651/creating-a-memory-leak-with-java?page=2&tab=votes#tab-top

Notez qu'ils ont un attribut rel=canonical qui pointe vers https://stackoverflow.com/questions/6470651/creating-a-memory-leak-leak-with-Java

Si je me souviens bien, Maile Ohye de SMX Advanced a déclaré que vous ne devriez PAS utiliser canonical de cette manière. Les réponses de la page 2 ne font pas double emploi avec le contenu de la première page. Le contenu dupliqué est l’objet du type de lien canonical.

Est-ce une utilisation appropriée de rel=canonical?

6
JeremyB

C'est une utilisation de la canonisation, et sans doute la plus importante, mais d'après les directives de contenu de Webmaster Tools, pagination :

Vous pouvez également ajouter un lien rel = "canonique" aux pages du composant pour indiquer à Google que la version de View All est la version à afficher dans les résultats de recherche.

Encore plus spécifique à votre exemple ci-dessus, le cas d'utilisation est que informations rel-canoniques tient également compte des différences de tri. La question SO à laquelle vous avez lié le lien n'est pas seulement paginée, mais également triée. En sélectionnant un autre onglet, vous placez un ensemble de réponses totalement différent sur la "page 2", qui pourrait continuer à fonctionner même à l'avenir, en fonction des votes, etc.

5
Su'

Je considérerais cela comme un abus de rel=canonical, et je suis plutôt surpris que Google semble l’honorer . (Tous les résultats que je vois proviennent de sites miroirs sans le lien rel=canonical, alors que la recherche de la réponse la plus votée fonctionne bien.)

Ce serait une chose si le lien canonique pointait vers une page "Voir tout", mais que (AFAIK) StackOverflow ne les ait pas. Ici, la deuxième page contient une quantité substantielle de contenu qui manque à la page supposée canonique.

Encore une fois, je suppose que l’effet net de faire cela n’est pas si différent de simplement mettre des balises méta noindex sur la deuxième page et les pages suivantes, sauf que tout le PageRank de ces pages est déplacé vers la page "canonique" d'être diffusé sur des liens sortants. Donc, je suppose que je comprends pourquoi Google pourrait considérer cela comme tolérable, même si cela semble rendre un mauvais service aux lecteurs.

(La chose appropriée à faire pour de telles pages, IMO, consisterait à utiliser rel=prev et rel=next sur les liens de pagination, qui SO semble déjà le faire. Selon la page sur laquelle Su 'est lié , Google tient compte de ces attributs et conduit généralement les visiteurs vers la première page, sans doute à moins qu'ils ne recherchent spécifiquement un élément trouvé plus tard. pages.)


Mise à jour: Google semble être d'accord:

"Bien qu'il soit correct de définir rel="canonical" à partir d'une URL de composant sur une seule page tout afficher, définir le canonique sur la première page d'une séquence sans paramètre est considéré comme un usage impropre. Nous ne nous engageons pas à respecter cette implémentation de rel="canonical". "

1
Ilmari Karonen