Natural Sounding Text to Speech?

76

Sto cercando un software di sintesi vocale facile da installare per Ubuntu che suona naturale. Ho installato Festival , Gespeaker , ecc., Ma nulla suona molto naturale. Tutto molto sintetico e difficile da capire.

Qualche raccomandazione là fuori?

    
posta I Heart Ubuntu 20.07.2011 - 19:36

13 risposte

18

Credo di aver trovato il miglior software TTS gratuitamente utilizzando un'estensione Google Chrome chiamata "SpeakIt". Funziona solo con il browser Chrome per me su Ubuntu. Non funziona con Chromium per qualche motivo. SpeakIt viene fornito con due voci femminili che sembrano entrambe molto realistiche rispetto a qualsiasi altra cosa là fuori. Ci sono almeno altri quattro maschi e amp; le voci femminili sono elencate nelle estensioni di Chrome se cerchi nel Chrome Web Store utilizzando "TTS" come query.

link

Da utilizzare su un sito Web. evidenzi il testo che vuoi leggere e fai clic con il pulsante destro del mouse e "SpeakIt" oppure fai clic sull'icona SpeakIt ancorata nella barra superiore di Chrome.

Gli utenti di Firefox hanno anche due opzioni. All'interno di addon di Firefox, fai una ricerca per TTS e dovresti trovare "Clicca Speak" e anche "Text to Voice". Le voci non sono buone come le voci di SpeakIt di Chrome, ma sono decisamente utilizzabili.

L'estensione SpeakIt utilizza la tecnologia iSpeech e al prezzo di $ 20 all'anno, il sito può convertire il testo in file audio MP3. È possibile inserire testo, URL, feed RSS, nonché documenti come TXT, DOC e PDF e output in MP3. Puoi creare podcast, incorporare audio, ecc. Ecco un link ...

link

e un campione del loro audio (non so per quanto tempo durerà il collegamento) ...

link

    
risposta data I Heart Ubuntu 27.01.2013 - 01:11
45

SVOX pico2wave

Oltre alle altre risposte:

Un TTS molto minimalista, un suono migliore di espeak o mbrola (a mio parere).

Alcune informazioni:
link

Non capisco perché pico2wave sia, rispetto a un espey o mbrola, raramente discusso. È piccolo, ma suona davvero bene (naturale). Senza modifiche sentirai una voce femminile dal suono naturale.

E ... rispetto a Mbrola, riconosce le Unità e la parla nel modo giusto!
Ad esempio:

  • 2 ° C → due gradi
  • 2m → due metri
  • 2kg → due chilogrammi

Dopo l'installazione lo uso in uno script:

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav ""
aplay /tmp/test.wav
rm /tmp/test.wav

Quindi eseguilo con il testo desiderato:

<scriptname>.sh "hello world"

o leggi il contenuto di un intero file:

<scriptname>.sh "$(cat <filename>)"

Questo è tutto per avere un TTS di lavoro leggero e stabile su Ubuntu.

    
risposta data user85321 24.08.2012 - 17:12
11

Semplice Google ™ TTS

A causa della mancanza di un'alternativa migliore ho scritto uno script bash che si interfaccia con uno script perl di Michal Fapso per fornire TTS tramite Google Traduttore. Dalla descrizione del progetto:

  

L'intenzione è quella di fornire un'interfaccia facile da usare per l'output text-to-speech tramite il sistema di sintesi vocale di Google. Un'opzione fallback che utilizza pico2wave fornisce automaticamente la sintesi TTS nel caso in cui non venga trovata alcuna connessione Internet.

     

Allo stato attuale, il wrapper supporta la lettura da input standard, file di testo semplice e la selezione X (testo evidenziato).

Le caratteristiche principali sono:

  • sintesi TTS online tramite Google translate
  • sintesi TTS offline via pico2wave
  • supporta una varietà di lingue diverse
  • può leggere da CLI, file di testo e testo evidenziato
  • supporta la lettura di testo evidenziato con formattazione fissa (ad esempio file PDF)

L'installazione e l'utilizzo sono documentati nella pagina del progetto .

Sarei felice se ci provassi. Segnalazioni di bug e qualsiasi altro feedback sono i benvenuti!

    
risposta data Glutanimate 23.08.2014 - 21:18
8

Ho guardato in alto e in basso per il text to speech di Ubuntu che è di alta qualità. Non c'è nessuno. Le mie corde vocali sono paralizzate, quindi avevo bisogno di TTS per aggiungere istruzioni vocali ai miei video di Ubuntu . Puoi ottenere software di sintesi vocale Linux di alta qualità commerciale qui: link È davvero molto costoso. Ho finito per acquistare Natural Reader per Windows (non funziona su Ubuntu con Wine) per $ 40. Forse più tardi avrò quello Linux.

Spero che questo aiuti.

    
risposta data Joe Steiger 20.07.2011 - 19:57
6

Ho svolto ricerche sulle migliori voci da testo a voce ottimamente suonate e sintonizzate. Di seguito è riportato un elenco di quelli che pensavo fossero i primi 5 prodotti in ordine di qualità del suono. La maggior parte dei siti Web associati a questi prodotti presenta una demo interattiva che ti consente di decidere autonomamente.

  1. NeoSpeech
  2. Ivona
  3. Acapela
  4. AT & amp; T voci naturali
  5. CereProc Voices
risposta data Jim 24.04.2012 - 17:35
6

Pico e espeak sono divertenti e facili da usare, ma non sono poi così bravi. Le voci predefinite del Festival non sono poi così buone. Tuttavia, Festival è un framework vocale basato su schemi, in cui un numero di ricercatori ha creato voci plug-in molto migliori. Puoi facilmente superare la qualità di pico2wave su Ubuntu, perché una di quelle voci è disponibile come pacchetto già pronto.

Per rendere il suono del Festival naturale, ecco cosa fare:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Puoi farlo dalla riga di comando usando -b (o --batch ) e mettendo ogni comando tra virgolette singole:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Puoi ottenere altre voci abbastanza buone dal repository Nitech, ma installarle è complicato e i percorsi predefiniti sono cambiati, quindi potrebbe essere necessario modificare manualmente i riferimenti ai nomi dei file nei file di schema in bundle per lavorare su Ubuntu.

    
risposta data Jon Watte 25.04.2017 - 21:31
5

Combina gli strumenti SVOX (pico) con LibreOffice:

Gli strumenti SVOX (pico) sono facili da installare e offrono voci di buona qualità in Ubuntu. Installalo:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Puoi usare LibreOffice in combinazione con gli strumenti SVOX (pico) installando l'estensione "Leggi il testo" e ottieni una "GUI" per questo eccellente software TTS:

Configura le opzioni dell'opzione Leggi testo con Strumenti - Componenti aggiuntivi - Leggi selezione. ... Usa / usr / bin / python come programma esterno. Seleziona un'opzione della riga di comando che include il token (PICO_READ_TEXT_PY) , potresti provare a sperimentarne alcuni.

Ora devi solo selezionare del testo in LO Writer, Calc, Impress o Draw e fare clic sull'icona aggiunta come barra degli strumenti (una faccia felice con un ballon).

    
risposta data leoperbo 15.12.2013 - 01:48
4

Trovo le voci Nitech HTS sul festival molto naturali e confortanti rispetto alle altre voci che ho ascoltato. Vedi questo link su come impostare Nitech e altri suoni con il festival. Non ho trovato un buon gui che possa essere usato per configurare quelle voci, ma impostarle tramite festival.scm funziona ancora. Quel post è molto vecchio e potresti voler trovare l'effettiva directory di installazione usando "locate festival" comando

    
risposta data razor 09.11.2011 - 14:56
4

Ecco cosa ho fatto per avere puro linguaggio naturale per pdf e altri file di testo (altre soluzioni non sono naturali o sono solo servizi a pagamento). Questo è in realtà un modo per aggirare l'utilizzo di cromo o cromo, ma funziona in modo facile e veloce.

  1. Installa l'estensione SpeakIt! sul tuo cromo o cromo.
  2. Installa PDF Viewer se utilizzi chromium (Chrome ha già un pdf visualizzatore gratuito) e selezionare le opzioni "Consenti in incognito" e "Consenti l'accesso agli URL dei file" nelle impostazioni delle estensioni di chromium.
  3. Trascina e rilascia il pdf nel browser.
  4. Ora evidenzia il testo e fai clic con il pulsante destro del mouse e seleziona SpeakIt! così puoi ascoltare la sintesi vocale naturale

Ci sono anche modi per aprire altri file come .doc e .txt in chrome e fare lo stesso. Esistono altre estensioni per Chrome che visualizzano i file PDF, controlla se ti sta meglio. Inoltre puoi caricare tutti i tipi di testo in Google Drive e utilizzare SpeakIt! leggerlo per te Un'altra estensione chiamata "Parla testo" funziona allo stesso modo e ha un linguaggio naturale.

    
risposta data Pooya Sanooei 12.12.2013 - 02:54
2

durante la ricerca di un motore tts migliore da utilizzare con la nuova modalità narrativa di firefox 49 ho trovato pico tts (svox) - il mio motore TTS preferito.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Come cambiare il sistema di sintesi vocale predefinito a livello di sistema?

Le persone di arch linux mi hanno indirizzato verso il percorso giusto ( link ):

Rimuovi il commento dal modulo che preferisci e impostalo come predefinito nelle impostazioni del dispatcher vocale:

#> vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Riavvia il daemon:

#> sudo systemctl restart speech-dispatcher.service

MA, quando avvii di nuovo Firefox, non succede nulla. Secondo il link qui sopra (forum arc 10 e 16) funziona con festival (non provato), ma il dispatcher vocale per pico non elenca le voci disponibili. Non funzionerà.

Qualche idea là fuori sarebbe molto apprezzata; -)

    
risposta data apos 14.11.2016 - 23:55
1

Il mio programma di sintesi vocale preferito si chiama Magic English, ma come Natural Reader menzionato da Joe Steiger, è un programma per Windows e non sono sicuro che verrà eseguito su Wine.

AT & amp; T Natural Voices è disponibile online come demo, ma è più un lavoro circa una soluzione ...

    
risposta data Chris Granger 20.07.2011 - 21:10
0

Per questo costruisco Intelligent Speaker - estensione per Google Chrome. Può leggere le pagine anche senza selezione (quando la detenzione del testo è corretta).

    
risposta data Vitaly Zdanevich 16.09.2017 - 20:02
0

Google TTS

Pico, mbrola, cmu, festival, flite, tutti SUCK nel 2017 (Erano incredibili negli anni '90). AT & amp; T discorso naturale (che è fantastico) non è linux compat e non è gratuito, quindi usiamo Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s 'pwd'/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
    
risposta data Jonathan 29.11.2017 - 06:32

Leggi altre domande sui tag