web-dev-qa-db-fra.com

GWMT Afficher les backlinks non existants "via un lien intermédiaire"

Je gère deux sites, le site A et le site B. Il s’agit de sites de commerce électronique, le site A étant construit en premier et les deux sites vendant la même chose. Ils sont hébergés séparément, utilisent un CMS distinct (un magento et un pinnacle) et n'utilisent pas de contenu dupliqué. Nous vendons des produits chimiques, ce qui est important car nous mettons à la disposition du téléchargement (conformément à la loi, les étiquettes et les fiches de données de sécurité desdits produits chimiques). Ce sont des documents légaux qui sont écrits par les fabricants pour la sécurité du consommateur, etc. Mon problème est que mon compte GWMT affiche plus de 16k backlinks allant du site B au site A, et que les 16k peuvent être associés à 24 fichiers pdf sur le site A qui étaient simplement copiés et collés dans le serveur du site b. GWMT les affiche sous forme de backlinks "via des liens intermédiaires" qui devraient indiquer un lien quelque part ET une redirection quelque part, qui n'existent ni l'un ni l'autre. Il n'y a pas de liens, il n'y a pas de redirections nulle part dans mon code. Ceux-ci ne devraient pas apparaître en premier lieu. Je n'ai aucun avertisseur de lien non naturel. Est-ce que quelqu'un a ce problème, ou une solution à ce problème? Pourquoi google montre-t-il ces liens en premier lieu? Suis-je pénalisé pour un contenu en double?

1
Jimmy

Google est certainement en train de reconnaître le contenu dupliqué. sauf si vous voyez des baisses de classement, il est peu probable que vous soyez pénalisé . Qu'est-ce qui se passe est probable:

  • Vous publiez le PDF sur un site: site1.example.com/docs/chemical-foo-safety-data.pdf
  • Vous publiez le PDF sur l'autre site: site2.example.com/pdf/safty-data-chemical-foo.pdf
  • Googebot reconnaît que ces deux documents sont identiques
  • Google choisit site1.example.com/docs/chemical-foo-safety-data.pdf comme document canonique
  • Lorsque Google voit un lien vers site2.example.com/pdf/safty-data-chemical-foo.pdf, il le traite comme s'il s'agissait d'un lien vers le document canonique.
  • Vous recevez des messages sur les redirections en raison de la manière dont Google traite la canonisation.

Bien que vous ayez l'obligation légale de publier ce contenu et de le mettre à la disposition de vos utilisateurs, vous n'avez pas à le rendre explorable. Il y a plusieurs raisons pour lesquelles vous pourriez vouloir le bloquer dans le fichier robots.txt:

  • Il n'a pas été écrit par vous et peut probablement être trouvé sur d'autres sites.
  • Vous l'avez sur vos deux sites et Google voit clairement vos deux sites comme liés à cause de cela.
  • Vous ne vous attendez pas à ce que les utilisateurs consultent votre site lors de la recherche de mots ou d'expressions contenus dans ces documents. Même si les documents attirent des visiteurs, vous préféreriez que les utilisateurs atterrissent sur une page où ils pourraient acheter des produits.

Pour plus d'informations, vous devriez lire Qu'est-ce qu'un contenu en double et comment puis-je éviter d'être pénalisé pour cela sur mon site? sur le moment où Google ne pénalise pas et ne pénalise pas le contenu en double.

0