J'ai un site de jeux et j'écris une API qui extraira des questions pertinentes de ma copie du dump de données SE. Je respecterai toutes les règles de licence.
Cela dit, j'hésite à le faire, car Google va pénaliser mon site pour la diffusion de contenu en double.
Existe-t-il un moyen légal de diffuser du contenu de vidage de données tout en respectant les termes du contrat de licence, sans encourir de pénalités pour les moteurs de recherche? Je souhaite diffuser ce contenu, mais je ne veux pas compromettre la fonction principale de mon site Web.
Je prévois d'utiliser Google API pour traduire le contenu dans ma langue maternelle. Je ne servirai pas le contenu en anglais.
Extrait de l'article de Google intitulé "Traiter habilement le contenu dupliqué" :
"... nos algorithmes ne verront pas le même article écrit en anglais et en espagnol comme un contenu dupliqué."
Si vous reproduisez un contenu sous licence dans une langue différente de celle de l'original, Google verra votre contenu comme étant l'original.
Si vous reproduisez du contenu dans la même langue, vous devez créer un lien vers la source pour vous assurer que Google attribue une note supérieure à celle de votre version. Le contenu reproduit sur votre site n'entraîne aucune "pénalité de contenu en double" qui affecte l'ensemble de votre site. cela signifiera simplement que ces pages dans la même langue seront plus faibles dans les résultats de la recherche que la version originale.
Pour une traduction humaine fiable, j'utilise et recommande mygengo.
Bien que je déconseille fortement d'utiliser Google pour les traductions (sauf si vous envisagez de les modifier ultérieurement), vous ne serez probablement pas pénalisé pour le contenu dupliqué, car Google ne recherchera pas le contenu comparé aux traductions dans d'autres langues pour l'indexation.
Si cela vous inquiète, assurez-vous de configurer un fichier robots.txt sur votre serveur pour indiquer à Google (et aux autres moteurs de recherche) de ne pas indexer le contenu du cliché. Vos utilisateurs pourront accéder aux informations, mais Google les ignorera.
Une recherche sur "robots.txt" donnera tous les détails sur la façon de le configurer.