web-dev-qa-db-fra.com

Données structurées pour les pages dynamiques et les outils pour les webmasters

J'ai un catalogue avec plus de 150000 (150k) pages d'article uniques, chacune avec schema.org configurée pour les titres, descriptions, images, prix, etc. Ces pages sont construites de manière dynamique grâce à un identifiant unique dans l'URL.

Malheureusement, cela inclut les articles en rupture de stock et les "anciens" articles pour lesquels tout ou partie du contenu requis par schema.org peut être vide. Il en résulte des indicateurs d'erreur générés dans Google Webmaster Tools.

Quelle serait la meilleure approche pour s'attaquer à ce catch-22?

  1. Fake schema.org Data (c'est-à-dire, le prix de NULL à "0,00"), qui n'est PAS le prix correct, suggérant que l'article est gratuit.

  2. Marquer la page comme noindex (qui peut être indexé un jour et noindex le lendemain pour être indexé quelques jours plus tard)

  3. Définissez un 301 sur une autre page.

  4. Définissez un 302 sur une autre page.

À l'heure actuelle, j'ai environ 18 000 pages indexées avec schema.org selon Google Webmaster Tools. J'ai l'impression que moins il y a d'erreurs causées par l'absence de schema.org pour les pages déjà indexées, plus Google liste rapidement les erreurs en suspens.

Des idées sur ce que la meilleure pratique serait pour un tel scénario?

2
David K.

Je dirais qu’il est généralement logique (principalement pour une bonne expérience utilisateur) de conserver des pages sur les produits en rupture de stock, qu’ils soient temporaires ou permanents. (Voir schema.org’s OutOfStock et Discontinued .)

Alors, quand vous gardez ces pages, que faire avec votre balisage schema.org?

Premièrement, si Google signalait une erreur schema.org, cela ne signifiait pas nécessairement que votre balisage schema.org était incorrect ( . Schema.org n'avait aucune propriété requise . ). Cela signifie simplement que votre utilisation du balisage n’est pas conforme aux règles propres à Google pour l’affichage de l’un de leurs extraits enrichis. Donc, le pire qui puisse arriver est que Google ne montre pas un extrait enrichi pour les pages en question.

Falsifier des données est une mauvaise idée. Si vous incluez également les fausses données de manière visible sur la page, vous induisez en erreur vos utilisateurs. Si vous le fournissez uniquement au niveau schema.org (par exemple, avec les éléments meta/link ou masqué via CSS), Google pourrait détecter ces contradictions. Et dans tous les cas, si un Rich Snippet est affiché, il affichera de fausses données. Comment cela pourrait-il être utile à quelqu'un?

Je vois donc deux solutions:

  • Si vous ne disposez pas du contenu approprié pour une propriété schema.org sur une page spécifique, omettez-la ici.
  • Si vous ne disposez pas du contenu approprié pour toutes les propriétés requises par Google pour l'affichage d'un extrait de code, omettez complètement le balisage schema.org pour cette page.

Je préférerais fortement la première solution. Bien que Google puisse ne pas afficher actuellement un extrait enrichi , ses règles pourraient changer à l'avenir. Et n'oubliez pas les autres moteurs de recherche qui utilisent schema.org (ils ont probablement des règles différentes) et les autres consommateurs (comme les add-ons de navigateur, les sites Web agrégés, etc.).

1
unor