web-dev-qa-db-fra.com

Texte naturel à la parole?

Je cherche un logiciel de synthèse de la parole facile à installer pour Ubuntu qui semble naturel. J'ai installé Festival, Gespeaker, etc., mais rien ne semble très naturel. Tous très synthétiques et difficiles à comprendre.

Des recommandations là-bas?

83
I Heart Ubuntu

SpeakIt!

Je pense avoir trouvé le meilleur logiciel TTS gratuitement en utilisant une extension Google Chrome appelée "SpeakIt". Cela ne fonctionne que dans le navigateur Chrome sur Ubuntu. Cela ne fonctionne pas avec le chrome pour une raison quelconque. SpeakIt est livré avec deux voix féminines qui paraissent toutes les deux très réalistes par rapport à tout le reste. Si vous recherchez le Chrome Web Store à l’aide de "TTS" comme requête, au moins quatre autres voix masculines et féminines sont répertoriées dans les extensions s Chrome.

Utilisation : À utiliser sur un site Web. vous mettez en surbrillance le texte que vous voulez lire, puis cliquez avec le bouton droit de la souris sur "SpeakIt" ou cliquez sur l'icône SpeakIt ancrée dans la barre supérieure Chrome.


Les utilisateurs de Firefox ont également deux options. Dans les addons de Firefox, faites ne recherche de TTS et vous devriez trouver "Cliquez sur Parler" ainsi que "Texte à la voix". Les voix ne sont pas aussi bonnes que les voix Chrome SpeakIt, mais elles sont définitivement utilisables.

L’extension SpeakIt utilise la technologie iSpeech et pour un prix de 20 USD par an, le site peut convertir du texte en fichiers audio MP3. Vous pouvez entrer du texte, des URL, des flux RSS, ainsi que des documents tels que TXT, DOC et PDF, puis les exporter au format MP3. Vous pouvez créer un podcast, intégrer de l'audio, etc. voici un lien , et n exemple de son (je ne sais pas combien de temps le lien durera).

21
I Heart Ubuntu

SVOX pico2wave

Un TTS très minimaliste, un meilleur son que espeak ou mbrola (à mon avis). Quelques informations ici .

Je ne comprends pas pourquoi pico2wave est, par rapport à espeak ou mbrola, rarement discuté. C'est petit, mais ça sonne vraiment bien (naturel). Sans modification, vous entendrez une voix féminine au son naturel.

ET ... comparé à Mbrola, il reconnaît les unités et le parle correctement!
Par exemple:

  • 2 ° C → deux degrés
  • 2m → deux mètres
  • 2 kg → deux kilogrammes

Après l'installation, je l'utilise dans un script:

#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Puis lancez-le avec le texte souhaité:

<scriptname>.sh "hello world"

ou lisez le contenu d'un fichier entier:

<scriptname>.sh "$(cat <filename>)"

C'est tout pour avoir un TTS stable et léger sous Ubuntu.

50
user85321

Pico et espeak sont amusants et faciles à utiliser, mais ils ne sont pas très bons. Les voix par défaut du Festival ne sont pas très bonnes non plus. Cependant, Festival est un cadre de parole basé sur un schéma, dans lequel un certain nombre de chercheurs ont construit de bien meilleures voix plug-in. Vous pouvez facilement surpasser la qualité pico2wave d'Ubuntu d'origine, car l'une de ces voix est disponible sous forme de package clé en main.

Pour rendre le festival naturel, voici ce qu'il faut faire:

Sudo apt-get install festival
Sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Vous pouvez le faire depuis la ligne de commande en utilisant -b (ou --batch) et en mettant chaque commande entre guillemets simples:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Vous pouvez obtenir d’autres voix assez bonnes à partir du référentiel Nitech, mais leur installation est complexe, et les chemins par défaut ont été modifiés. Il peut donc être nécessaire de modifier manuellement les références aux noms de fichier dans les fichiers de schéma fournis pour pouvoir fonctionner avec Ubuntu.

13
Jon Watte

Simple Google ™ TTS

Mise à jour depuis la page du projet (2019-02) : Ce projet n’est pas entretenu et le restera dans un avenir prévisible


En raison de l'absence d'une meilleure alternative, j'ai écrit un script bash qui s'interface avec n script Perl de Michal Fapso pour fournir la synthèse vocale via Google Translate. De la description du projet:

L'intention est de fournir une interface facile à utiliser pour la sortie texte-parole via le système de synthèse vocale de Google. Une option de secours utilisant pico2wave fournit automatiquement la synthèse TTS si aucune connexion Internet n’est trouvée.

Dans l'état actuel des choses, l'encapsuleur prend en charge la lecture à partir de l'entrée standard, des fichiers texte brut et de la sélection X (texte en surbrillance).

Les principales caractéristiques sont:

  • synthèse TTS en ligne via Google Translate
  • synthèse TTS hors ligne via pico2wave
  • prend en charge une variété de langues différentes
  • peut lire à partir de la CLI, des fichiers texte et du texte en surbrillance
  • prend en charge la lecture de texte en surbrillance avec un formatage fixe (par exemple, fichiers PDF)

L'installation et l'utilisation sont documentées sur le page du projet .

Je serais heureux si vous essayiez. Rapports de bugs et autres commentaires sont les bienvenus!

12
Glutanimate

J'ai cherché haut et bas un texte de synthèse vocale pour Ubuntu de grande qualité. Il n'y en a pas. Mes cordes vocales sont paralysées, il fallait donc que TTS ajoute des instructions vocales à mes vidéos Ubunt . Vous pouvez obtenir un logiciel de synthèse vocale Linux de haute qualité et commercial ici . C'est vraiment très cher. J'ai fini par acheter Natural Reader pour Windows (ne fonctionne pas sous Ubuntu sous Wine) pour 40 $. Peut-être que plus tard, j'aurai celui de Linux.

8
Joe Steiger

Je mène des recherches sur les voix au texte qui sonnent le mieux et qui s’accordent le mieux. Vous trouverez ci-dessous une liste de ce que je pensais être le top 5 des produits par ordre de qualité sonore. La plupart des sites Web associés à ces produits ont une démo interactive qui vous permettra de prendre vos propres décisions.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. AT & T Voix Naturelles
  5. Voix CereProc
6
Jim

Combinez les outils SVOX (pico) avec LibreOffice:

Les outils SVOX (pico) sont faciles à installer et apportent des voix de bonne qualité dans Ubuntu. Installez-le:

Sudo apt-get install libttspico0 libttspico-utils libttspico-data

Vous pouvez utiliser LibreOffice en combinaison avec les outils SVOX (pico) en installant la extension "Read Text" et vous obtenez une "interface graphique" pour cet excellent logiciel TTS:

Configurez les options de lecture des extensions de texte avec Outils - Add-ons - Lire la sélection .... Utilisez /usr/bin/python en tant que programme externe. Sélectionnez une option de ligne de commande incluant le jeton (PICO_READ_TEXT_PY) , vous pouvez en expérimenter certaines.

Il ne vous reste plus qu'à sélectionner du texte dans LO Writer, Calc, Impress ou Draw et à cliquer sur l'icône ajoutée sous forme de barre d'outils (un visage heureux avec un ballon).

5
leoperbo

Je trouve les voix de Nitech HTS au festival très naturelles et réconfortantes par rapport aux autres voix que j'ai entendues. Voir ce lien sur la façon de configurer Nitech et d’autres sons avec festival. Je n'ai pas trouvé de bon gui que je peux utiliser pour configurer ces voix mais les régler via festival.scm fonctionne toujours. Ce message est très ancien et vous voudrez peut-être trouver le répertoire d'installation à l'aide de la commande "localiser le festival"

5
razor

Voici ce que j'ai fait pour avoir du langage naturel pur pour les fichiers PDF et autres fichiers texte (les autres solutions ne sont pas naturelles ou ce sont juste des services payants). C’est en fait un moyen de contourner le chrome ou chrome, mais fonctionne rapidement et facilement.

  1. Installez SpeakIt! extension sur votre chrome ou chrome.
  2. Installez visionneuse PDF si vous utilisez du chrome (chrome a déjà une visionneuse pdf gratuite) et cochez les options "Autoriser incognito" et "Autoriser l'accès aux URL des fichiers" dans les paramètres d'extensions de chrome.
  3. Glissez-déposez votre pdf dans le navigateur.
  4. Maintenant, mettez du texte en surbrillance, cliquez avec le bouton droit de la souris et sélectionnez SpeakIt! afin que vous puissiez écouter de la synthèse vocale naturelle.

Il existe également des moyens d'ouvrir d'autres fichiers tels que .doc et .txt dans chrome et de faire de même. Il y a d'autres extensions pour chrome qui affichent les fichiers pdf, vérifiez si cela vous convient mieux. De plus, vous pouvez télécharger tous types de textes dans Google Drive et utiliser SpeakIt! le lire pour vous. Une autre extension appelée 'Speak text' fonctionne de la même manière et a un langage naturel.

4
Pouya Sanooei

Lors de la recherche d'un meilleur moteur tts à utiliser avec le nouveau firefox 49 mode narratif , j'ai trouvé pico tts (svox) - mon moteur TTS préféré.

Sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Comment changer le système de moteur de synthèse vocale par défaut?

People sur Arch Linux m'a amené sur le bon chemin:

Décommentez le module que vous aimez et faites-le par défaut dans les paramètres du répartiteur de parole:

# Sudo vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Redémarrez le démon:

# Sudo systemctl restart speech-dispatcher.service

MAIS, lors du redémarrage de Firefox, rien ne se passe. Selon le lien ci-dessus (messages de forum Arch. N os 10 et 16) fonctionne avec festival (n’a pas essayé), mais le répartiteur de parole de pico ne répertorie pas les voix disponibles. Ça ne courra pas.

Toute idée serait très appréciée ;-)

2
apos

Pour cela je construis Intelligent Speaker - extension pour Google Chrome. Il peut lire des pages même sans sélection (lorsque la rétention de texte est correcte).

1
Vitaly Zdanevich

Simple Google ™ TTS

Pico, mbrola, cmu, festival, flite, tous SUCK en 2017 (Ils étaient incroyables dans les années 90). Le discours naturel d'AT & T (ce qui est fantastique) n'est pas Linux compat et n'est pas gratuit, nous utilisons donc Google

git clone https://github.com/Glutanimate/simple-google-tts.git
Sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-Perl libwww-mechanize-Perl libhtml-tree-Perl so$
cd simple-google-tts
Sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
1
Jonathan

Mon programme de synthèse vocale préféré s'appelle Magic English, mais comme Natural Reader mentionné par Joe Steiger, il s'agit d'un programme Windows et je ne sais pas s'il fonctionnera sous Wine.

AT & T Natural Voices est disponible en ligne sous forme de démo, mais c'est plus une solution de contournement qu'une solution ...

1
Chris Granger

gTTS

gTTS ( Google synthèse vocale ), une bibliothèque Python et Outil de la CLI pour l’interface avec l’API Google Translate. Écrit les données mp3 parlées dans un fichier, un objet de type fichier (bytestring) pour une manipulation audio ultérieure, ou stdoutname__.

Inconvénients : CLI uniquement. Vous devez être en ligne, car cela nécessite de demander à Google public endpoint ouvert.

Sudo -H pip install gTTS  # Install

Usage

gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -

Documentation et autres exemples

Autres

Certains ont déjà été mentionnés

1
Pablo Bianchi