Je dois vérifier une tonne d'images pour voir si elles contiennent un mot-clé. Quelqu'un peut-il recommander une bonne bibliothèque OCR fiable? Je sacrifierai volontiers la vitesse pour la précision.
Il n'y a pas de Java bibliothèques OCR qui ont quelque chose à voir avec la précision . En fonction de votre budget, vous pouvez choisir quelque chose qui n'est pas purement Java, mais qui peut être appelé depuis Java:
Si vous avez l'intention de ne pas reconnaître les symboles latins ou numériques, mieux vaut trouver une bibliothèque non Java, mais sélectionner parmi certains outils (externes) et utiliser d'autres moyens (1) pour obtenir votre texte. Sur Linux J'ai utilisé cuneiform (2) via l'interface de ligne de commande.
l'interface de ligne de commande et le tuyau, par exemple.
cuneiform a porté sur Linux mais je ne connais pas l'interface de ligne de commande de travail pour Windows