web-dev-qa-db-fra.com

Qu'est-ce qu'un contenu en double et comment puis-je éviter d'être pénalisé pour cela sur mon site?

Ceci est une question générale du wiki de la communauté concernant le contenu dupliqué.

Si votre question était fermée en tant que duplicata de cette question et que vous estimiez que les informations fournies ici ne fournissaient pas une réponse suffisante, veuillez ouvrir la discussion sur Pro Webmasters Meta .


  1. Qu'est-ce que Google considère comme un contenu en double?
  2. La manière dont je présente mon contenu entraînera-t-elle une pénalité de contenu en double?
  3. Comment éviter que le contenu de mon site soit traité comme un contenu en double?
36
danlefree

Le guide pour les administrateurs de contenu (=== -) de Google définit le contenu dupliqué (à des fins d'optimisation des moteurs de recherche) comme "des blocs de contenu importants dans ou entre des domaines qui correspondent complètement à d'autres contenus. ou sont sensiblement similaires ".

Le guide de Google énumère ensuite les exemples suivants de doublons de contenu:

  • Forums de discussion pouvant générer à la fois des pages régulières et des pages réduites destinées aux appareils mobiles
  • Stocker les éléments affichés ou liés via plusieurs URL distinctes
  • Version imprimable des pages Web

Pénalités

Les moteurs de recherche doivent pénaliser certaines occurrences de contenu en double conçues pour spammer leur index de recherche, telles que:

  • sites de nettoyage qui copient le contenu en gros
  • techniques simplistes de filature d'article qui génèrent un "nouveau" contenu en remplaçant de manière sélective des mots dans le contenu existant.

Lorsque les moteurs de recherche trouvent un contenu en double, ils peuvent:

  • Pénaliser un site entier contenant du contenu en double. (quand spammy)
  • Choisissez une page comme source canonique du contenu et réduisez la priorité ou n'indexez pas l'autre page avec la duplication. (commun)
  • Ne prenez aucune mesure punitive et indexez plusieurs copies du contenu (rare)

Eviter la duplication interne

Matt Cutts de Google , interrogé par Google, a déclaré qu'il ne devrait vous faire mal que s'il paraissait spammé . Toutefois, de nombreux webmasters utilisent les techniques suivantes pour éviter les contenus inutiles. reproduction:

  • Assurez-vous que le contenu n'est accessible que sous une URL canonique
  • Si votre site doit renvoyer le même contenu sous plusieurs URL (par exemple, pour une page "Vue d'impression") , spécifiez manuellement une URL canonique avec un élément de lien dans le champ. en-tête de document
  • Dans les cas où votre site renvoie un contenu similaire en fonction de paramètres encodés dans l'URL (par exemple, le tri d'un catalogue de produits) , excluez les paramètres d'URL dans les outils pour les webmasters de Google.

Syndication de contenu

La publication de contenu sur votre site qui a été publié ailleurs est appelée syndication de contenu. La création de contenu en double via la syndication de contenu peut être OK:

  • Tant que vous avez la permission de le faire
  • Vous dites à vos utilisateurs quel est le contenu et d'où il vient
  • Vous créez un lien vers une source originale (un lien direct profond vers le contenu original de la page avec la copie, et pas seulement un lien vers la page d'accueil du site où se trouve l'original)
  • Vos utilisateurs le trouvent utile
  • Vous avez quelque chose à ajouter à ce contenu, de sorte que les utilisateurs préfèrent le trouver sur votre site qu'ailleurs. (Commentaire ou critique par exemple.)
  • Vous avez également suffisamment de contenu original sur votre site (au moins 50% d'origine, mais idéalement à 80% d'origine)

Même si Google ne pénalise pas chaque contenu dupliqué, le contenu dupliqué non pénalisé ne vous aidera peut-être pas à attirer des visiteurs:

  • Vous êtes en concurrence avec tous les autres exemplaires qui sont là-bas
  • Google préférera probablement la source d'origine du contenu et la copie la plus réputée du contenu.

Google pénalisera le contenu dupliqué publié sur votre site Web à partir d'autres sources si:

  • Il semble avoir été gratté ou volé (surtout sans attribution).
  • Les utilisateurs ne réagissent pas bien (en particulier, en revenant sur Google après avoir visité votre site.)
  • Il existe tellement de copies qu'il n'y a aucune raison d'envoyer les utilisateurs à votre copie.
  • Votre copie n'est pas l'original, la plus réputée ou la plus utilisable. et n'a aucun commentaire ou critique.
  • Votre site ne contient pas suffisamment de contenu original pour équilibrer tout le contenu republié.
  • Vous dupliquez tellement de pages sur votre propre site que Googlebot ne parvient pas à analyser le site complet.

Internationalisation et ciblage géographique

La localisation de contenu est un domaine dans lequel la duplication de contenu peut être bénéfique pour le référencement. Il est parfaitement correct de publier le même contenu sur des sites destinés à différents pays et parlant la même langue. Par exemple, vous pouvez avoir un site américain, un site britannique et un site australien, tous avec le même contenu.

Avec un site pour chaque pays, il est généralement possible de mieux classer les utilisateurs de ce pays. En outre, il est possible de répondre spécifiquement aux utilisateurs de chaque pays avec des différences d’orthographe mineures, une tarification dans la devise du pays ou des options d’expédition de produits. Pour plus d'informations sur la configuration de sites Web géo-ciblés, voir Comment dois-je structurer mes URL pour le référencement et la localisation?

Faire face aux racleurs de contenu

D'autres sites qui volent votre contenu et le republient sans autorisation peuvent parfois causer des problèmes de contenu en double pour votre site. Les moteurs de recherche travaillent dur pour s'assurer qu'il est difficile pour les sites de récupération de tirer parti de la duplication de votre contenu . Si un site de raclage vous cause des problèmes, vous pouvez peut-être supprimer le site de l'index de Google en en déposant une demande DMCA auprès de Google .

31
danlefree

En termes simples, le contenu dupliqué est copié à partir d'autres sources Web.

Google peut facilement identifier s'il s'agit d'un contenu unique ou d'un contenu de plagiat.

Il est préférable d'écrire vous-même du contenu pour le site Web.

Si votre site Web contient du contenu en double, vous ne pouvez pas être sur la première page de Google et vous serez pénalisé par les consignes de Google. De plus, vous ne serez pas non plus dans 100 positions sur SERP.

0
cstpl123