J'ai besoin d'une bibliothèque d'OCR ouverte capable de numériser des formules mathématiques imprimées complexes (par exemple, des formules générées via LaTeX). Je souhaite obtenir des sorties de type LaTeX (ou juste des données de type AST).
Y a-t-il déjà quelque chose comme ça? Ou les techniques OCR actuelles sont-elles simplement capables d’analyser du texte orienté ligne?
(Notez que j'ai également posté cette question sur Metaoptimize car certaines personnes pourraient avoir des connaissances supplémentaires.)
Le problème a également été décrit par OpenAI comme im2latex .
SESHAT est un système open source écrit en C++ permettant de reconnaître des expressions mathématiques manuscrites. SESHAT a été développé dans le cadre d’une thèse de doctorat au centre de recherche PRHLT de l’Universitat Politècnica de Valencia.
Une démo en ligne: http://cat.prhlt.upv.es/mer/
La source: https://github.com/falvaro/seshat
Seshat est un système open-source permettant de reconnaître des expressions mathématiques manuscrites. À partir d'un échantillon représenté sous la forme d'une séquence de traits, l'analyseur est capable de le convertir en LaTeX ou en d'autres formats comme InkML ou MathML.
InftyReader est le seul que je connaisse. Ce n'est PAS un logiciel libre (il semble que l'argent aille à une organisation à but non lucratif, l'IIRC).
http://www.sciaccess.net/en/InftyReader/
Je ne sais pas pourquoi PDF ne peut pas avoir de métadonnées dans LaTeX? Comme dans: mettez l'équation LaTeX dedans! Est-ce si difficile? (Je ne connais rien à la syntaxe PDF, mais j'imagine que cela peut être fait).
La syntaxe LaTeX est LA NORME LA PLUS ESSAYÉE ET LA VRAIE NORME pour la notation mathématique. Cela semble incroyablement stupide que les gens qui ont produit MathML et d'autres choses ne prennent pas cela en considération. InftyReader génère une syntaxe MathML ou LaTeX.
Si je veux du HTML (pur), j'utilise alors TTH pour lire la syntaxe LaTeX. Fonctionne juste.
ABBYY FineReader (un excellent programme d'OCR) affirme que vous pouvez former le logiciel pour les mathématiques, mais c'est immensément braindead (qui a le temps?)
Et Unicode a beaucoup de symboles mathématiques. Le fait que les lecteurs d'OCR actuels ne puissent pas les suivre montre l'état déplorable du logiciel et le déficit cérébral de cette activité.
En ce qui concerne "un symbole à la fois", TeX a évidemment des règles quant à l'emplacement des symboles. Ils ne peuvent pas écrire de logiciels qui connaissent ces règles?! TeX est même du domaine public! Ils peuvent simplement "l'utiliser" dans leurs produits commerciaux.
D'après les réponses sur Metaoptimize et la discussion sur la liste de diffusion Tesseract , il ne semble pas exister de solution ouverte/libre pour le faire.
La seule solution qui semble pouvoir le faire (mais je ne peux pas vérifier car il s'agit uniquement de Windows et n'est pas libre) est, comme quelques personnes l'ont mentionné, le InftyProject .
Découvrez " Web Equation ." Il peut convertir des équations manuscrites en LaTeX, MathML ou SymbolTree. Je ne suis pas sûr si le moteur est open source.
Considérant que les technologies actuelles lisent un symbole à la fois (voir http://detexify.kirelabs.org/classify.html ), je doute qu'il existe un OCR pour des équations mathématiques complètes.
Infty fonctionne assez bien. Mon ancienne société l'a intégrée dans une application qui lit les équations à haute voix pour les aveugles et qui reçoit un bon retour des utilisateurs.
Etant donné que la sortie de l'OCR mathématique pour les formules complexes comportera probablement des bogues - même les humains auront des problèmes avec cela - vous devrez relire les résultats, au moins s'ils comptent. Le relecteur (humain) devra ensuite corriger les résultats, ce qui signifie que vous devez disposer d'un éditeur de formules mathématiques. Étant donné l’effort requis par les humains, le corpus probablement limité de formules complexes, il vous sera peut-être plus facile d’assigner la tâche à des humains.
En tant que problème de recherche, lire des mathématiques par OCR est amusant - vous avez besoin d’un formalisme pour les grammaires 2D ainsi que d’un identificateur de symboles.
En plus des références déjà mentionnées ici, pourquoi ne pas google pour cela? Des travaux ont été effectués à Caltech, Rochester, à l’Université de Waterloo et à l’Université de Berkeley. Combien est-il prêt à utiliser hors de la boîte? Dunno.
Vous savez, il existe une application dans Win7 juste pour cela: Panneau de saisie mathématique . Il gère même la saisie manuscrite (il est en fait fait pour cela). Essayez si vous avez Win7, c'est gratuit!
il y a cette superbe courte vidéo: http://www.youtube.com/watch?v=LAJm3J36tLQ expliquant comment vous pouvez entraîner votre lecteur fine à reconnaître les formules mathématiques Si vous utilisez déjà Fine Reader, il vaut mieux rester avec un seul outil. Bien sûr ce n’est pas un article gratuit :(