web-dev-qa-db-fra.com

Contenu dupliqué apparaissant pour les sites multilingues

J'ai un site qui a une URL par défaut dire "http://www.blahblah.com/" (qui est par défaut en langue anglaise). Sur mon site, il existe un support pour plusieurs langues. J'ai quelques liens sur ma page d'accueil, par exemple "anglais", "français", "espagnol", etc., et en cliquant sur ces liens, l'utilisateur est redirigé vers ces liens:

http://www.blahblah.com/en-us/ (anglais)

http://www.blahblah.com/fr-ca/ (français)

http://www.blahblah.com/spanish-culture/ (espagnol)

et basé sur la culture dans l'URL, je montre le contenu en conséquence aux utilisateurs finaux dans la langue de leur choix. Voilà comment était mon site. La question que je reçois est avec le référencement. J'ai remarqué que Google envisage (j'ai vérifié via Google Web Master) de dupliquer les pages de mon site, comme par exemple:

1. http://www.blahblah.com/documents/ et http://www.blahblah.com/en-us/documents/

2. http://www.blahblah.com/news/ et http://www.blahblah.com/en-us/news

de même, toutes les pages sont considérées comme un contenu dupliqué dans les outils Google pour les webmasters. Cela m'inquiète, car je pense que mon site est pénalisé en raison de son classement. Pourriez-vous laisser une idée de la façon de surmonter cette situation?

5
Rocky Singh

Vous pouvez utiliser rel = "alternate" hreflang = "x" en HTML, en Sitemap XML ou en-tête HTTP pour gérer le contenu en double dans plusieurs langues/régions de Google. Donc, vous pourriez avoir, par exemple:

  • US: rel = "replacement" hreflang = "en-US"
  • UK: rel = "substitut" hreflang = "en-GB"
  • Canada (français): rel = "substitut" hreflang = "fr-CA"

Être sûr d'utiliser les codes ISO corrects, bien sûr. Notez que cela doit se produire au niveau de la page. Blahblah.com/en-us/nuts.html devra spécifier ses équivalents dans la langue ou les variantes de langue disponibles. Notez également que vous devez spécifier la page en cours comme alternative .

Un autre élément clé consiste à vous assurer que votre contenu est bien dans la bonne langue ou une variante de la région ciblée, donc du contenu en anglais destiné au Royaume-Uni. devrait utiliser les conventions et orthographes anglais britanniques.

Et sur ce point, si vous fournissez seulement - ou avez seulement besoin de fournir - un ensemble de contenu en anglais pour l’ensemble du monde anglophone, utilisez simplement "en" et omettez le code de pays.

Je crois que Bing utilise toujours le méta du langage, vous pouvez donc utiliser l'attribut lang - <html lang="en-US"> - ou la balise méta.

2
GDav

En ayant un "contenu dupliqué", Google décidera lui-même quelle page renvoyer dans les SERP - pas vous. Soit http://www.blahblah.com/news/ OR http://www.blahblah.com/en-us/news. C'est la seule "peine".

En supprimant le "doublon", VOUS décidez quelle page Google renvoie dans les SERP.

Pour supprimer le contenu en double, vous devez indiquer à Google quelle est la page préférée. Vous pouvez le faire soit en redirigeant (301 - redirection permanente) de l'un vers l'autre, soit en spécifiant un élément <link rel="canonical"... dans la section head, en précisant explicitement l'URL canonique (préférée).

Ce qui est la page préférée est vraiment à vous, mais je choisirais peut-être la page avec la langue par défaut (c.-à-d. en-us) comme page canonique et simplement nous y diriger. Ensuite, toutes les URL de page ont la même structure. Ainsi, toutes les demandes de http://www.blahblah.com/news/ seront redirigées vers la langue par défaut, c'est-à-dire. http://www.blahblah.com/en-us/news, etc. Etant donné que vous avez déjà un lien en anglais menant à http://www.blahblah.com/en-us/, il semblerait que cela ait un sens, OMI.

2
MrWhite