web-dev-qa-db-fra.com

Auto-hébergement d'un système de type recaptcha pour numériser mes livres téléchargés

De wikipedia

reCAPTCHA est un système ... qui utilise CAPTCHA pour numériser le texte des livres tout en protégeant les sites Web des robots

Je voudrais convertir beaucoup de documents numérisés et je voudrais introduire un captcha sur mon site Web, alors pourquoi ne pas faire d'une pierre deux coups?

Le projet reCAPTCHA a son propre programme mais se concentre sur les archives du New York Times et les livres de Google Books.

Existe-t-il un projet similaire que je pourrais héberger et dicter ainsi les livres/documents numérisés?

7
Craig

Utilisez le OCR de Google pour numériser ces livres. En ce qui concerne l'utilisation de vos propres livres pour traduire, il n'y a actuellement aucun logiciel tiers disponible pour cela. Pour ajouter un raisonnement à cet égard, un extrait du site CAPTCHA;

Devrais-je faire mon propre CAPTCHA?

Généralement, créer votre propre script CAPTCHA (par exemple, en utilisant PHP, Perl ou .Net) est une mauvaise idée car il existe de nombreux modes de défaillance. Nous vous recommandons d'utiliser une implémentation bien testée telle que reCAPTCHA.

En outre, il parle lors d’une conférence TED sur le thème de reCAPTCHA. Si vous en avez l'intention, faites-le également.

1
Christopher