web-dev-qa-db-fra.com

Convertir la parole (fichiers audio mp3) en texte

Je cherche un convertisseur simple du mp3 au txt. J'ai essayé, sans succès: julius, CMU Sphinx, ... Au cours des 4 dernières heures, je n'ai pas trouvé le moyen de les utiliser (ou de les installer correctement).

Ce que je recherche, c'est quelque chose comme:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

Je suis également très bien avec l'application graphique car je n'ai que quelques fichiers à convertir et peut cliquer autour.

Edit: Avec l'aide de cette réponse Application de reconnaissance vocale pour convertir des MP3 en texte? J'ai réussi à le faire fonctionner, mais il ne produit aucune sortie. En fait, cela produit quelques lignes vierges (aucun mot détecté) ...

8
Samo

pochesphinx fera la parole au texte à partir d'un fichier audio existant. Selon le format initial du mp3, vous aurez peut-être besoin de deux commandes distinctes.

Commencez par convertir votre fichier audio existant au format de saisie obligatoire:

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

Le run pochesphinx

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

le fichier créé myspeech.txt aura ce que vous cherchez.


Si vous êtes nouveau sur Ubuntu, vous devez installer les programmes ci-dessus à l’aide de cette commande:

    Sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg
2
64pi0r