Je suis en train de construire un petit service d'agrégation de nouvelles où il recueille des nouvelles de quelque 1 600 sources sur le Web et analyse les articles extraits. (Je ne récupère que les flux RSS.) À cet égard, je souhaite utiliser Google Reader en tant que plate-forme . Cela signifie que mon application extrait tous les flux d’alimentation d’une source unique (compte Google Reader) et que mon compte Google Reader collecte les flux d’alimentation des 1600 sources auxquelles je suis abonné. Puis-je utiliser Google Reader pour un usage commercial comme celui-ci? J'ai déjà soulevé une question sur les forums Google Reader et je cherche une réponse. Si quelqu'un ici a utilisé Google Reader pour un usage similaire, veuillez me le faire savoir.
L'interfaçage avec Reader améliore-t-il le traitement par rapport à l'extraction directe des flux?
Si vous analysez (et enrichissez?) Les flux, je suppose que vous utilisez quelque chose comme Calais et Solr dans le cadre de votre pile de traitement. Avec 1600 flux, vous parlez d'un nombre important d'entrées à traiter. Reader fournit-il suffisamment de bande passante pour extraire les entrées assez rapidement pour que votre service reste pertinent?
J'imagine que vos machines de traitement et d'enrichissement doivent être virtualisées sur un espace cloud évolutif (compte EC2 ou autre) et qu'il serait beaucoup plus efficace de définir un calendrier de traitement que de lancer un flot de publications de Google.
Cela mis à part, le Google Terms of Service contient quelques entrées qui peuvent être une mauvaise nouvelle:
5.3 Vous acceptez de ne pas accéder (ou tenter d'accéder) aux Services par d'autres moyens que par l'interface fournie par Google, sauf autorisation spécifique de votre part dans un contrat séparé conclu avec Google. Vous acceptez expressément de ne pas accéder (ou tenter d'accéder) aux Services par aucun moyen automatisé (y compris par l'utilisation de scripts ou de robots d'exploration de sites Web) et vous devez vous conformer aux instructions énoncées dans tout fichier robots.txt présent sur les Services. .
Si vous utilisez des scripts pour analyser votre compte 1600-feed, cela peut constituer une violation.
5.4 Vous acceptez de ne pas vous engager dans une activité qui perturbe ou perturbe les services (ou les serveurs et réseaux connectés aux services).
Faire analyser et traiter vos flux par Google, puis utiliser cette bande passante, peut interférer avec le fonctionnement normal de Reader.
5.5 Sauf stipulation contraire de votre part, dans un contrat séparé conclu avec Google, vous acceptez de ne pas reproduire, dupliquer, copier, vendre, échanger ou revendre les Services à quelque fin que ce soit.
Ce dernier semble répondre assez directement à votre question.