Comment installer un nouveau pack de langues pour Tesseract le 16.04

Question

Vient d’installer gscan2pdf v1.3.9 ainsi que Tesseract. Quant à ce dernier, il est apparu au bas de ma liste de logiciels installés, mais maintenant, il semble avoir disparu, même s'il fonctionne toujours (je pense).

Quoi qu'il en soit, j'essaie de transformer un fichier PDF d'un document numérisé en texte modifiable, mais le document n'est pas en anglais, donc gscan en fait un gâchis.

Les seules options que je reçois lorsque je vais à Tools > OCR > Language to recognize sont English, equ et osd. Des idées sur la façon dont je peux installer un pack de langue spécifique?

Je ne suis pas un utilisateur Linux expérimenté, des instructions détaillées seraient donc les bienvenues.

Abhijit Ghosh · Accepted Answer

Installez simplement le langage ocr nécessaire en utilisant ceci:

Sudo apt-get install tesseract-ocr-[lang]

Où [lang] peut être

all

OR

afr amh ara asm aze aze-cyrl bel ben bod bos bul cat ceb ces chi-sim chi-tra chr cym dan dan-frak deu deu-frak dev dzo ell enm epo est eus fas fin fra frk frm gle gle-uncial glg grc guj hat heb hin hrv hun iku ind isl ita ita-old jav jpn kan kat kat-old kaz khm kir kor kur lao lat lav lit mal mar mkd mlt msa mya nep nld nor ori pan pol por pus ron rus san sin slk slk-frak slv spa spa-old sqi srp srp-latn swa swe syr tam tel tgk tgl tha tir tur uig ukr urd uzb uzb-cyrl vie yid