web-dev-qa-db-fra.com

Hreflang & dupliquer le contenu sur un site Web multilingue

J'ai un site Web multilingue comme celui-ci:

example.com/de/about
example.com/fr/about
example.com/about (English)

Il y a environ 3000 utilisateurs sur ce site. Beaucoup d'entre eux ont une photo de profil, un nom mais pas beaucoup écrit sur leur page de profil. Ça signifie

example.com/de/sarah
example.com/fr/sarah
example.com/sarah (English)

ont le même contenu et ne diffèrent que par les en-têtes/pieds de page/chapelure traduits.

J'ai un problème similaire avec mes articles de blog. Ils ne sont qu'en anglais et les versions linguistiques ne diffèrent que par les en-têtes/pieds de page/chapelure traduits.

Ma première pensée a été de mettre toutes les versions linguistiques hreflang annotations et une balise canonique menant à la version anglaise. Cependant, j'ai trouvé n article de Search VI qui dit que je ne devrais pas le faire:

Si vous utilisez une solution de balises canoniques sur votre site Web, assurez-vous que les URL comportant une balise canonique pointant vers une autre URL ne reçoivent pas d'annotations hreflang. Les annotations hreflang conviennent pour les URL pointant sur une balise canonique et pour les URL ne comportant pas de balise canonique.

J'ai trouvé un autre cas extrême ici: balise canonique pour le contenu non traduit sur un site multilingue où les sites de langue ne différaient pas du tout (pas même dans la navigation). La solution ici consistait à utiliser "noindex" pour les autres versions linguistiques. Est-ce la meilleure solution ici aussi? Il y a l'inconvénient que les Allemands et les Français trouveront une URL vers un profil ou un blog avec une navigation en anglais uniquement.

4
Adam

Avec rel=canonical dans plusieurs langues (par exemple, de -> canonique -> en), vous dites que ces pages sont équivalentes et que vous avez une préférence quant à l'URL à indexer. Si tel est le cas, si vous pensez que le passe-partout traduit n’ajoute pas plus de valeur (ce qui pourrait être le cas), cela (alors j’appellerais le "langage canonique") semble être une bonne configuration.

Si, au contraire, le passe-partout traduit fait une grande différence, vous voudriez alors utiliser rel=canonical dans les pages de langue (auto-canonique par langue) et utiliser hreflang entre les versions de langue. . Google peut ainsi choisir la bonne version linguistique et la montrer à l'utilisateur dans les résultats de la recherche.

L'avantage d'utiliser une configuration de langue canonique est que vous avez moins de pages indexées, ce qui facilite un peu la tâche pour obtenir plus de contenu indexé. L'inconvénient est que vous devez choisir une langue canonique (soit globalement, soit par contenu, elle n'a pas besoin d'être identique sur tout le site), et que les utilisateurs de la recherche risquent de se retrouver sur une page difficile à comprendre. . Pour les pages de profil et le contenu généré par l'utilisateur (UGC) en général (vous ne pouvez pas traduire facilement le contenu), je pense qu'il y a des arguments à défendre pour l'une ou l'autre de ces configurations. Je vous recommande donc d'examiner votre contenu c’est purement du contenu UGC, ou les profils sont-ils liés à d’autres fonctionnalités?), aux capacités dont vous disposez (le reste du site est-il déjà localisé? Les fonctionnalités de base sont-elles bien localisées?) et à vos utilisateurs atterrissant sur une page avec du contenu standard dans une autre langue, ou seraient-ils immédiatement perdus?). Pour tout ce qui n'est pas anodin, je ferais aussi des études sur les utilisateurs et, idéalement, testerais une partie de votre site pour essayer d'obtenir un retour plus objectif sur ces deux approches.

10
John Mueller