Je travaille sur un site Web multilingue où les éditeurs de contenu effectuent parfois des traductions partielles d'une page dont la majorité du contenu est encore la langue principale (l'anglais).
Le propriétaire du site Web utilise Siteliner pour consulter son site Web et les rapports soulignent souvent les pages partiellement traduites en tant que contenu dupliqué.
Cependant, nous ne savons pas si Google considère ces pages partiellement traduites comme un contenu dupliqué et leur applique des pénalités. Nous utilisons la méta hreflang de Google dans le code HTML pour identifier/lier les traductions.
J'ai discuté avec le propriétaire du site Web, qui a déclaré ne pas s'inquiéter de ce que Google le pénalise pour le contenu en double. Je ne trouve rien dans la console de recherche Google qui suggère qu'un contenu en double est un problème.
Est-il possible de tester un site Web pour voir si Google détecte un contenu en double/des sanctions sont appliquées?
Je vais m'embarrasser, mais je pense que vos craintes sont en grande partie non fondées.
Si j'ai bien compris, Google ne pénalise pas les contenus en double, ils ne se classent tout simplement pas très bien.
Pensez à Associated Press, s'il y avait un contenu en double "pénalité", les organes de presse qui diffusaient des histoires publiées par AP seraient pénalisés.
Ou des sociétés d'hébergement ... combien ont une copie exacte de la documentation pour Apache, cPanel, etc.
Voici un vidéo du webmaster de Google avec Matt Cutts en discutant.
Ce que vous décrivez n'est pas du spam, alors je pense qu'il est plus probable qu'ils ne considèrent tout simplement pas une page partiellement traduite comme unique/originale/suffisamment précieuse pour la classer correctement.
L’édition humaine et la traduction dans différentes langues est un processus long et difficile, et je pense que Google obtient cela (essayez de consulter la documentation de Google Tag Manager en russe et vous verrez ce que je veux dire).
Vous avez mentionné l'utilisation de l'outil Siteliner, qui vérifie uniquement le contenu dupliqué interne, mais je parlerai également de la duplication externe du contenu.
Contenu dupliqué externe
Copiez un paragraphe ou deux du contenu qui vous préoccupe et collez-le dans une recherche Google.
Voyez-vous votre site arriver en haut du résultat de la recherche? Si ce n'est pas le cas et que d'autres sites au-dessus de vous ont le même contenu, alors oui, vous avez des problèmes avec le contenu dupliqué externe et Google ne considère pas votre page comme la source d'origine.
Cela ne pénalise pas nécessairement l'ensemble de votre site. Toutefois, cela pénalise votre site en ce sens que les pages dont le contenu est dupliqué à l'extérieur ne seront pas classées comme si leur contenu était unique.
Contenu en double interne
Copiez un paragraphe ou deux du contenu qui vous préoccupe et collez-le dans une recherche Google à l'aide de cet opérateur de recherche site:exmaple.com then type the paragraph of text here
Voyez-vous beaucoup de pages différentes apparaître dans les résultats de recherche de votre site? Si oui, vous pourriez avoir des problèmes avec le contenu dupliqué interne.
Le problème ici dépend de la quantité de contenu dupliqué en interne. S'agit-il de sections en gros du contenu principal (numéro) ou d'un contenu standard qui apparaît sur toutes les pages, mais la majorité du contenu des pages est unique (pas de problème réel)?
Encore une fois, cela ne pénalise pas nécessairement l'ensemble de votre site. Toutefois, cela pénalise votre site en ce sens que les pages dupliquées en interne peuvent ne pas être classées aussi bien que si leur contenu était unique.
Le problème principal lié au contenu dupliqué interne à grande échelle est que les pages incorrectes peuvent apparaître dans les résultats de la recherche par rapport à ce que vous souhaitez voir apparaître et/ou que les pages peuvent tomber dans les "résultats omis" de Google, car elles ne sont pas jugées suffisamment pertinentes.
Vous pouvez donc effectuer des recherches, utiliser les résultats de siteliner, rechercher ce contenu dans Google et voir comment vous vous situez.
N'apparaissez-vous pas du tout, les classements sont-ils bas, les pages sont-elles classées de la page de votre site où vous préféreriez que d'autres pages soient classées à leur place, voyez-vous des pages tomber dans les résultats omis, etc.
Si vous constatez un tel problème, corrigez-le si nécessaire.