KTTS"> MBROLA"> ]> Manuale di &ktts; Gary R. Cramblitt garycramblitt@comcast.net FedericoZenith
federico.zenith@member.fsf.org
Traduzione della documentazione in italiano
2004-2005 Gary R. Cramblitt &FDLNotice; 2005-07-31 1.05.00 &ktts; - il sistema di pronuncia di &kde; - è un servizio basato su plugin che permette a qualsiasi applicazione di &kde; (o non di &kde;) di parlare usando l'interfaccia &DCOP;. &ktts; vuole essere l'implementazione dell'API di pronuncia di &kde;. KDE accessibilità kdeaccessibility TTS Pronuncia KTTSD kttsmgr festival flite hadifix MBROLA freetts epos SSML
Introduzione &ktts; è un sottosistema all'interno di &kde; per la pronuncia (TTS). Fornisce un'API comune per i programmatori di &kde; per dare capacità TTS alle loro applicazioni. Fornisce alcune capacità interessanti anche agli utenti. Funzionalità per gli utenti: Pronuncia i contenuti di un file di testo. Pronuncia gli eventi di notifica di &kde; (KNotify). Pronuncia tutto o parte del testo di una pagina Web in &konqueror;. Pronuncia tutto o parte del testo nell'editor di testo &kate;, inclusi i casi in cui &kate; sia incorporato in un'altra applicazione di &kde;. I testi lunghi sono divisi in frasi. L'utente può scorrere per frase o paragrafo, ripetere, mettere in pausa e interrompere la riproduzione. Output audio attraverso &arts;, ALSA, GStreamer (versione 0.8.7 o successiva) o aKode. Filtri configurabili dall'utente per sostituire le parole pronunciate male, scegliere i sintetizzatori vocali, e trasformare i documenti XHTML/&XML;. Funzionalità per i programmatori: Sistema di priorità per gli output di lettura a schermo, gli avvertimenti e i messaggi, durante la riproduzione di testi normali. Architettura basata su plugin per il supporto di una grande varietà di motori e driver di sintesi vocale. Permette la generazione di parlato dalla riga di comando (o attraverso script della shell) usando i programmi &DCOP; di &kde;. Fornisce un'interfaccia leggera e facile da usare per far generare output parlato alle applicazioni. Le applicazioni non devono preoccuparsi di contendersi il dispositivo di pronuncia. In futuro: fornirà supporto per linguaggi a marcatori per il parlato, come VoiceXML, Sable, &Java; Speech Markup Language (JSML), e Speech Markup Meta-language (SMML). In futuro: fornirà supporto limitato per i marcatori di pronuncia incorporati. Asincrono per evitare il blocco del sistema. &ktts; consiste in realtà di più programmi: kttsd il demone di pronuncia di &kde;, che è un'applicazione senza interfaccia che fornisce servizi TTS alle applicazioni attraverso &DCOP;. kttsmgr un'applicazione con interfaccia per configurare e controllare kttsd. kttsmgr risiede nel vassoio di sistema. libkhtmlkttsdplugin Un plugin per il browser Web &konqueror; che ti permette di pronunciare tutto o parte del testo di una pagina Web. ktexteditor_kttsd Un plugin per l'editor di testo &kate; che ti permette di pronunciare tutto o una parte di un file di testo. Supporto Oltre alla banca dati Bugzilla di &kde; (http://bugs.kde.org/), le discussioni su &ktts; hanno attualmente luogo sulla mailing list kde-accessibility. Iscriviti a https://mail.kde.org/mailman/listinfo/kde-accessibility. Gli sviluppatori si possono incontrare anche su IRC (irc.kde.org, canale #kde-accessibility). Usare &ktts; Prima di poter usare &ktts;, devi installare almeno un motore di sintesi vocale e assicurarti che funzioni. Vedi . Avviare <command >kttsmgr</command > Per avviare il sistema &ktts;, digita il comando seguente in una &konsole; kttsmgr e fai clic su kttsmgr nel menu di &kde;. Se questa è la prima volta che esegui kttsmgr, o se non hai ancora configurato nessun oratore, appare la schermata Oratori. Vedi . Se hai già configurato almeno un oratore, appare la schermata Generale. Vedi . Configurazione dei plugin di sintesi (oratori) La maggior parte dei sintetizzatori da voce a testo offrono più lingue e voci, e possono offrire più generi, volumi e velocità. Puoi configurare più di un'istanza di un sintetizzatore. Ogni combinazione di lingua, sintetizzatore, voce, genere, volume e velocità è detta un oratore. Devi configurare almeno un oratore prima di poter avviare &ktts; e cominciare a pronunciare il testo. Avere più oratori per lo stesso sintetizzatore è simile ad avere più code di stampa per la stessa stampante fisica. Quando le applicazioni inviano del testo a &ktts;, potrebbero specificare gli attributi dell'oratore preferito per la sintesi. Per esempio, un'applicazione potrebbe richiedere un oratore inglese femminile. Se hai configurato un oratore con sia la lingua inglese che genere femminile, sarà usato quello, altrimenti sarà automaticamente scelto l'oratore che gli assomiglia di più. Per saperne di più su come &ktts; sceglie gli oratori, vedi . Quando fai clic sulla linguetta Oratori in kttsmgr, appare la schermata Oratori. Questa schermata appare automaticamente anche se avvii kttsmgr e non hai ancora configurato nessun oratore. Il gestore della pronuncia di &kde; (scheda Oratori). Il gestore della pronuncia di &kde; (scheda Oratori) Fai clic per aggiungere un nuovo oratore. Qui sono elencati tutti gli oratori configurati. Gli oratori di priorità massima sono elencati in alto. L'oratore in cima sarà usato per la pronuncia quando un'applicazione non ne specifica uno. Fai clic su un oratore nell'elenco per evidenziarlo e fai clic su questo pulsante per rimuoverlo. Fai clic su un oratore nell'elenco per evidenziarlo e fai clic su questo pulsante per visualizzare la finestra di configurazione del plugin di sintesi. Vedi sotto. Fai clic su un oratore nell'elenco per evidenziarlo e fai clic su questo pulsante per spostarlo in basso di una riga nell'elenco. Più in basso un oratore è nell'elenco, minore è la sua priorità. Fai clic su questi pulsanti per applicare i cambiamenti apportati al sistema &ktts; in esecuzione. Quando fai clic sul pulsante Aggiungi, appare la schermata Aggiungi oratore. La schermata Aggiungi oratore. La schermata Aggiungi oratore Puoi selezionare un plugin di sintesi vocale per nome del Sintetizzatore, o per la Lingua che il sintetizzatore può pronunciare. Fai clic sul pulsante a scelta singola di fianco alla casella corrispondente. Quando è selezionato il pulsante Lingua, la casella Lingua mostra tutte le lingue supportate da tutti i sintetizzatori disponibili, e la casella Sintetizzatore mostra solo quei sintetizzatori che supportano la lingua selezionata. Quando è selezionato il pulsante Sintetizzatore, la casella Sintetizzatore mostra tutti i sintetizzatori disponibili, e la casella Lingua mostra solo le lingue supportate dal sintetizzatore selezionato. Scegli qui una lingua e un plugin di sintesi. Quando fai clic qui, la maggior parte dei plugin di sintesi si configureranno automaticamente da soli, scegliendo una configurazione predefinita. Apparirà un nuovo oratore nell'elenco della schermata Oratori. Fai clic sul pulsante Modifica per visualizzare o modificare la configurazione dell'oratore. Quando fai clic sul pulsante Aggiungi nella scheda Oratori e aggiungi un oratore che non può configurarsi automaticamente, o fai clic sul pulsante Modifica, appare la schermata Configurazione degli oratori. Ogni plugin di sintesi vocale ha una diversa schermata di Configurazione degli oratori. La seguente è un esempio per configurare il plugin Festival Interattivo. Per le specifiche per ogni tipo di plugin, vedi . Configurazione degli oratori Configurazione degli oratori Specifica il percorso al programma eseguibile Festival. Se Festival è nella tua variabile d'ambiente PATH, inserisci semplicemente festival. Fai clic per scansionare le voci disponibili. Seleziona una voce. Seleziona una codifica dei caratteri per il testo inviato a Festival. Per le voci note a &ktts;, questa impostazione verrà fatta automaticamente. In generale, le lingue occidentali usano ISO 8859-1. Le lingue europee orientali come il ceco e lo slovacco usano ISO 8859-2. Fai clic per provare. Dovresti sentire una frase di prova che viene pronunciata. Usa questi controlli per impostare il volume, la velocità di pronuncia, e il tono della voce sintetizzata. Se alcuni di questi sono disattivi (in grigio), la voce scelta non supporta la possibilità di cambiarli. Alcune voci, come le voci MultiSyn, sono così grandi che richiedono diversi secondi per essere caricate. Segnare questa casella le farà caricare quando KTTSD viene avviato, risparmiando tempo (al costo di usare più memoria) prima che sia sintetizzata la prima frase. Fai clic sul pulsante OK per salvare le impostazioni di configurazione dell'oratore. Assicurati di fare clic sul pulsante Applica, altrimenti i tuoi cambiamenti non avranno effetto sull'esecuzione del sistema &ktts;. Ammesso che la prova abbia funzionato, sei quasi pronto per iniziare a usare &ktts;. Ora ritorna alla schema Generale e segna la casella Abilita il sistema di pronuncia (KTTSD). Ciò avvierà il demone TTS di &kde;. Vedi . Puoi ora iniziare a usare &ktts; per pronunciare del testo. Fai clic sulla scheda Processi per creare e gestire processi di testo. Vedi . Avviare KTTSD e impostare le opzioni generali Una volta che hai configurato almeno un oratore, puoi avviare il sistema di pronuncia di &kde;. Fai clic sulla scheda Generale. Apparirà la schermata Generale. Puoi anche impostare alcune opzioni generali in questa schermata. Il gestore della pronuncia di &kde; (scheda Generale). Il gestore della pronuncia di &kde; (scheda Generale) Segna questa casella per attivare il sistema &ktts;. Ciò avvia il demone TTS di &kde; (KTTSD). Se KTTSD è avviato correttamente, apparirà la scheda Processi. Una volta che KTTSD è stato avviato, puoi iniziare a creare e pronunciare processi di testo. Vedi . Deselezionarla fermerà KTTSD e disattiverà il sistema TTS di &kde;. Se questa casella è disabilitata, non hai ancora configurato nessun oratore (o hai dimenticato di fare clic sul pulsante Applica). Vedi . Quando questa casella è segnata, appare un'icona nel vassoio di sistema ogni volta che kttsmgr è in esecuzione. In questa modalità, fare clic su OK o Annulla non fa terminare kttsmgr. Invece, la schermata sparisce ma kttsmgr continua a funzionare nel vassoio di sistema. Fai clic sull'icona per ripristinare la schermata. Per uscire da kttsmgr, fai clic destro sull'icona nel vassoio di sistema e scegli Esci. Quando non è segnata, non appare nessuna icona nel vassoio di sistema. Fare clic su OK o Annulla fa terminare kttsmgr. Quando kttsmgr termina, &ktts; rimane in esecuzione se la casella Abilita il sistema di pronuncia (KTTSD) è segnata. Questa opzione non avrà effetto fino alla prossima volta che kttsmgr verrà avviato. Questa opzione non ha effetto quando kttsmgr è in esecuzione nel &kcontrol;. Quando questa casella è segnata, appare la schermata kttsmgr quando avvii kttsmgr. Se non è segnata, l'icona di kttsmgr appare nel vassoio di sistema quando kttsmgr viene avviato, ma la schermata non appare. Fai clic sull'icona nel vassoio di sistema per far apparire la schermata. Quando questa casella è segnata, e kttsmgr non è già in esecuzione, apparirà nel vassoio di sistema ogni volta che KTTSD sta pronunciando. Ciò ti dà la possibilità di interrompere o intervenire in altro modo sulla pronuncia. Quando questa casella è segnata, e kttsmgr appare automaticamente nel vassoio di sistema durante la pronuncia, esso sparirà automaticamente alla fine della pronuncia. Assicurati di fare clic qui per salvare le tue impostazioni. Gestire i processi di testo Quando fai clic sulla linguetta Processi in kttsmgr, appare la schermata Processi. Il gestore della pronuncia di &kde; (scheda Processi). Il gestore della pronuncia di &kde; (scheda Processi) Tutti i processi di testo attualmente in coda sono elencati qui, insieme all'applicazione che ha messo in coda il processo, l'attuale stato del processo, il numero di frasi nel processo, e il numero della frase attuale. L'ID della voce corrisponde alla colonna ID nella schermata Oratori. I pulsanti in questa riga ti permettono di avviare, eliminare, e mettere in pausa i processi di testo. Seleziona un processo nell'elenco sopra, quindi fai clic su uno di questi pulsanti. I pulsanti in questa riga ti permettono di mandare avanti o indietro di una frase alla volta all'interno del processo selezionato nell'elenco sopra (non tutti i processi hanno più parti). I pulsanti in questa riga ti permettono di pronunciare il testo attualmente negli appunti di &kde;, o aprire un file di testo da pronunciare. Puoi anche aggiornare l'elenco di processi di testo o cambiare l'oratore di un processo. Vedi . La frase attualmente pronunciata appare qui. Quando fai clic su OK, tutti i cambiamenti alle impostazioni su altre schermate sono applicati (se ce ne sono) e kttsmgr viene minimizzato nel vassoio di sistema. Fai clic sull'icona nel vassoio di sistema per ripristinare la schermata. Trascina questo divisore per ridimensionare i pannelli dell'elenco dei processi e della Frase attuale. La scheda Processi appare solo quando KTTSD è in esecuzione. Se non vedi la scheda Processi, fai clic sulla linguetta Generale e segna la casella Abilita il sistema di pronuncia (KTTSD). Se non hai installato il sottosistema audio &arts;, ma hai ALSA, GStreamer o aKode, fai clic sulla linguetta Audio. Vedi . Su questa schermata sono elencati e controllati solo i processi di testo. L'output del lettore dello schermo, gli avvertimenti e i messaggi non sono visualizzati. Per maggiori informazioni sui tipi di messaggi di &ktts;, vedi . Impostazioni audio Quando fai clic sulla linguetta Audio in kttsmgr, appare la schermata Audio. Il gestore della pronuncia di &kde; (scheda Audio). Il gestore della pronuncia di &kde; (scheda Audio) Seleziona qui il metodo di output audio. Se un componente è in grigio, &ktts; è stato compilato senza supporto per quel plugin audio, o &ktts; non è stato in grado di caricare le librerie necessarie. Se per l'output audio è selezionato GStreamer o aKode, seleziona qui il metodo del pozzo dell'audio. Se non sono elencati dei pozzi, devi installarne almeno uno. Se ALSA è selezionato, scegli qui il dispositivo PCM. Vedi . Regola qui la velocità della pronuncia. 50% è circa due volte più lento del normale, mentre 200% è circa due volte più veloce. Devi avere installato il programma sox perché questa impostazione possa funzionare. Quando questa casella è segnata, &ktts; copierà dei file audio temporanei (file .wav) nella cartella indicata. Scegli qualsiasi cartella che vuoi sul tuo disco fisso, ma devi averci accesso in scrittura. Questo può essere utile per creare file audio di pronuncia per altri scopi. I file avranno dei nomi nella forma kttsd-P-NF, dove P è il numero del processo, e NF il numero della frase. I file esistenti con lo stesso nome saranno cancellati. Non dimenticarti di deselezionare questa casella, altrimenti il tuo disco fisso si riempirà! Assicurati di fare clic su Applica per applicare le nuove impostazioni al sistema &ktts; in esecuzione. Ci sono due modi di regolare la velocità del parlato in &ktts;. Molti degli oratori hanno una impostazione di Velocità nelle loro finestre di configurazione, che puoi visualizzare facendo clic su Modifica nella schermata Oratori. Questa impostazione della Velocità nella schermata Audio si aggiunge a quella dell'oratore e generalmente può essere usata anche se l'oratore non ne supporta una. Affinché questa impostazione della velocità funzioni, devi avere installato sul tuo sistema il programma sox (utenti Debian: apt-get install sox). Inoltre, questa impostazione di velocità viene ignorata quando si pronuncia del testo contenente SSML (vedi ). L'elenco di dispositivi ALSA include tutti i dispositivi PCM ALSA e i plugin configurati nel tua sistema. Molte delle scelte non funzioneranno. Devi sperimentare per trovare un dispositivo che funzioni per te. Nel dubbio, scegli predefinito. Impostazioni di interruzione del testo Quando fai clic sulla linguetta Interruzione in kttsmgr, appare la schermata Interruzione. Il gestore della pronuncia di &kde; (scheda Interruzione). Il gestore della pronuncia di &kde; (scheda Interruzione) Questa schermata ti permette di specificare azioni speciali da eseguire ogni volta che un processo di testo viene interrotto da un altro messaggio di maggiore priorità. Ci sono quattro tipi di processi di pronuncia gestiti da &ktts;: Testo normale. Messaggi. Avvertimenti. Output del lettore dello schermo. L'output del lettore dello schermo ha la massima priorità. È riservato all'uso da parte delle applicazioni del lettore dello schermo. L'output del lettore dello schermo blocca tutti gli altri messaggi, mettendo quei processi in pausa. Una volta che l'output del lettore dello schermo sarà stato pronunciato, i processi interrotti riprenderanno automaticamente. Gli avvertimenti sono la seconda priorità. È riservata a messaggi ad alta priorità, come "La CPU si sta surriscaldando". Un avvertimento bloccherà i messaggi e il testo normale, mettendoli in pausa. Una volta che l'avvertimento sarà stato pronunciato, i processi interrotti riprenderanno automaticamente. I messaggi seguono nell'ordine di priorità. Un messaggio bloccherà i processi di testo normale. &kmouth; è un esempio di applicazione che usa i messaggi. Per esempio, mentre leggi un lungo testo da una pagina Web, &kmouth; può essere usato per salutare qualcuno che entra nella stanza. Tutti i quattro tipi di processi sono code, eccetto l'output del lettore dello schermo. Se un output del lettore dello schermo viene inviato da un'applicazione mentre &ktts; sta pronunciando un altro output del lettore dello schermo, il messaggio pronunciato viene interrotto e perso. Quando un processo di testo viene interrotto da un messaggio, un avvertimento o un output del lettore dello schermo, &ktts; aggiungerà gli output audio di questa schermata al flusso. Questo messaggio viene pronunciato ogni volta che viene interrotto un processo di testo. Questo file audio è riprodotto ogni volta che un processo di testo normale viene interrotto. Se sono specificati sia un Pre-suono che un Pre-messaggio, il Pre-suono è riprodotto prima del Pre-messaggio. Questo messaggio è pronunciato ogni volta che un processo di testo interrotto riprende. Questo file audio è riprodotto ogni volta che un processo di testo interrotto riprende. È riprodotto per ultimo. Le impostazioni in questa schermata si applicano solo ai processi di testo normale. I messaggi, gli avvertimenti e gli output del lettore dello schermo non hanno azioni speciali per quando sono bloccati da un messaggio di maggiore priorità. Pronunciare il testo di pagine Web Mentre usi il browser Web &konqueror; di &kde;, puoi pronunciare il testo della pagina Web visualizzata. Innanzi tutto assicurati che &ktts; sia in esecuzione. Evidenzia il testo che vuoi sia pronunciato e scegli StrumentiPronuncia testo nel menu principale. Dopo poco, il testo evidenziato dovrebbe iniziare a essere pronunciato. È quasi sempre una buona idea evidenziare il testo della pagina Web che vuoi sia pronunciato. Puoi saltare questo passo, ma sentirai molte intestazioni &HTML; e altri tag invisibili che vengono pronunciati. Pronunciare testo nell'editor di testo &kate; Quando usi l'editor di testo avanzato di &kde; (&kate;), puoi pronunciare il testo visualizzato. Prima assicurati che &ktts; sia in esecuzione. Evidenzia il testo che vuoi sia pronunciato e scegli StrumentiPronuncia testo nel menu principale. Dopo poco, il testo evidenziato dovrebbe iniziare a essere pronunciato. Non devi per forza evidenziare il testo prima. In quel caso, sarà pronunciato tutto il file. Ciò funziona anche quando &kate; è in esecuzione incorporato in un'altra applicazione, come &konqueror; o &quanta;. Notifiche vocali (KNotify) KNotify è il sottosistema di notifica di &kde;, che ti avverte di eventi che configuri all'interno del sistema &kde;. Puoi configurare &ktts; per pronunciare le notifiche testuali. Per esempio, &konversation;, un'applicazione IRC per &kde;, ti permette di configurare un'ampia varietà di notifiche. Per esempio, puoi dire a &konversation; di notificarti ogni volta che un messaggio contenente il tuo nome appare in un canale IRC. Insieme a &ktts;, puoi far pronunciare a &kde; il testo del messaggio IRC. In generale, se un'applicazione &kde; supporta KNotify, apparirà un elemento Notifiche nel menu Impostazioni dell'applicazione. Le specifiche per la configurazione di ogni applicazione con KNotify cambiano con l'applicazione. Per abilitare &ktts; a pronunciare le notifiche testuali di KNotify, avvia kttsmgr, e fai clic sulla linguetta Notifiche. Apparirà la schermata Notifiche. Il gestore della pronuncia di &kde; (scheda Notifiche). Il gestore della pronuncia di &kde; (scheda Notifiche) Segna questa casella per abilitare la pronuncia delle notifiche di &kde;. Se non è segnata, tutto il resto di questa schermata sarà disabilitato, e &ktts; non pronuncerà nessuna notifica. Se segnata, ogni applicazione che invia eventi con un suono non sarà pronunciata da &ktts;. Usa questi pulsanti per aggiungere o eliminare eventi delle applicazioni dall'elenco sotto. Quando fai clic sul pulsante Aggiungi, appare una schermata nella quale selezioni l'applicazione e l'evento che vuoi aggiungere all'elenco. Questo evento pronuncerà il messaggio che &konversation; invia quando qualcuno fa il tuo nome in un messaggio IRC. Per tutti gli altri eventi in arrivo da &konversation;, non verrà intrapresa nessuna azione in &ktts;. Per tutti gli eventi non altrimenti specificati nell'elenco, non verrà intrapresa nessuna azione in &ktts;. Usa questa casella per specificare cosa dovrebbe fare &ktts; quando riceve un evento. Le tue scelte sono: Pronuncia il nome dell'evento Pronuncia il nome dell'evento; ciò che vedi elencato nell'elenco degli eventi in questa schermata. Pronuncia l'evento di notifica Pronuncia il messaggio come viene inviato dall'applicazione. Non pronunciare la notifica Non pronuncia per niente questo evento. Pronuncia del testo personalizzato Pronuncia il testo che inserisci nella casella a destra. Se l'azione è Pronuncia testo personalizzato, inserisci qui il testo del messaggio che vorresti far pronunciare. Nel messaggio, puoi usare le seguenti stringhe di sostituzione: %e Il nome dell'evento %a Il nome dell'applicazione che ha inviato l'evento %m Il messaggio inviato dall'applicazione Prova il messaggio facendo clic qui. Puoi specificare qui gli attributi dell'oratore desiderato per pronunciare il messaggio di notifica. predefinito userà l'oratore più in alto nella schermata Oratori. Vedi . Nota che ci sono tre livelli di eventi. Se è specificata un'azione per un evento particolare di una particolare applicazione, viene intrapresa quella. Altrimenti, se è specificata un'azione per tutti gli altri eventi di un'applicazione specifica, viene intrapresa quella. Altrimenti, viene intrapresa l'azione specificata per tutti gli altri eventi sotto Predefinito (tutti gli altri eventi). L'evento tutte le notifiche per l'applicazione Predefinito (tutti gli altri eventi) non può essere eliminato dall'elenco. Per l'impostazione predefinita per tutti gli altri eventi, puoi specificare il tipo di notifiche che vengono pronunciate, come segue: nessuno Non ne sarà pronunciato nessuno. finestre di notifica Saranno pronunciate le notifiche che visualizzano una finestra sullo schermo, che tu devi rimuovere. finestre a comparsa passive Saranno pronunciate le notifiche che visualizzano una finestra a comparsa passiva, che sparisce da sola dopo un po'. finestre delle notifiche e finestre a comparsa passive Saranno pronunciate le notifiche che appaiono sullo schermo, in modo passivo o meno. tutte le notifiche Saranno pronunciate tutte le notifiche, indipendentemente da se producono una visualizzazione o meno sullo schermo. I filtri di sostituzione delle stringhe sono un buon modo di ripulire i messaggi inviati dalle applicazioni se vengono pronunciati male da &ktts;. Il file kmail.xml, incluso in &ktts;, è un buon esempio. Rimuove i tag br e b dai messaggi di notifica di &kmail;, e rimuove anche l'espressione /local/inbox, siccome questo è un assunto ragionevole nella maggior parte dei casi. Vedi . Usa il pulsante Salva per salvare le tue impostazioni delle notifiche in un file. Usa il pulsante Carica per caricare delle impostazioni salvate in un file. Gli eventi caricati sono fusi con gli eventi esistenti nell'elenco. Se vuoi cominciare con un elenco di eventi vuoto, fai clic prima sul pulsante Pulisci. Saranno cancellati tutti gli eventi tranne quelli per tutte le notifiche. Assicurati di fare clic su Applica o OK per salvare le tue impostazioni. SSML Il linguaggio a marcatori di sintesi vocale (SSML) è uno standard W3C per marcare del testo per l'output vocale. Fornisce i tag per controllare voci, velocità di pronuncia, volume, sesso, e tono. Fornisce anche dei tag per controllare come sono pronunciate le parole, per esempio per sillabare delle abbreviazioni. SSML fa parte della specifica VoiceXML, che è anch'essa uno standard W3C. Per ora, &ktts; fornisce supporto limitato e di base per SSML. Attualmente ha le seguenti restrizioni. Funziona solo con gli oratori Festival Interattivo e Hadifix. Devi installare la voce rab_diphone (maschio britannico), perché questa è la voce predefinita di Festival quando pronuncia SSML. L'impostazione Velocità nella schermata Audio è ignorata quando si pronuncia del testo contenente SSML. Se le impostazioni Velocità o Tono nella configurazione di Festival non sono impostate al 100%, faranno normalmente pronunciare l'SSML in maniera piatta. Si può usare il seguente testo campione in inglese per sperimentare con SSML. Who's been sleeping in my bed? said papa bear. Who's been sleeping in my bed? said momma bear. Who's been sleeping in my bed? said baby bear. ]]> È previsto un miglior supporto di SSML nella prossima versione di &ktts;. Filtri (Avanzato) I filtri sono una funzionalità avanzata di &ktts;. Non sono necessari per l'uso di base di &ktts;. I filtri sono usati per preelaborare il testo prima di inviarlo al motore di sintesi vocale. Sono utili per migliorare la pronuncia, per sostituire le parole pronunciate male o per le abbreviazioni, scegliere la lingua e l'oratore appropriati per la pronuncia, o aggirare certi limiti dei sintetizzatori vocali e delle loro voci. Tipi di messaggi di &ktts; Per capire come si usano i filtri, è utile prima capire come viene elaborato il testo da &ktts;. Il testo pronunciato da &ktts; può essere di quattro tipi. Output del lettore dello schermo. Avvertimenti. Messaggi Processi di testo Il tipo è determinato dall'applicazione che invia il testo a &ktts;. L'output del lettore dello schermo ha la massima priorità. È riservato all'uso da parte delle applicazioni del lettore dello schermo. L'output del lettore dello schermo blocca tutti gli altri messaggi, mettendo quei processi in pausa. Una volta che l'output del lettore dello schermo sarà stato pronunciato, i messaggi interrotti riprenderanno automaticamente. Gli avvertimenti sono la seconda priorità. È riservata a messaggi ad alta priorità, come "La CPU si sta surriscaldando". Un avvertimento bloccherà i messaggi e il testo normale, mettendoli in pausa. Una volta che l'avvertimento sarà stato pronunciato, i messaggi interrotti riprenderanno automaticamente. I messaggi seguono nell'ordine di priorità. Un messaggio bloccherà i processi di testo normale. &kmouth; è un esempio di applicazione che usa i messaggi. Per esempio, mentre leggi un lungo testo da una pagina Web, &kmouth; può essere usato per salutare qualcuno che entra nella stanza. Anche le notifiche di &kde; sono messaggi (vedi ). Il resto sono normali processi di testo. Qualsiasi processo che avvii dalla scheda Processi è un processo di testo. KSayIt è un esempio di applicazione che usa i processi di testo. I processi di testo sono fatti per la pronuncia, non urgente, di lunghi spezzoni. Tutti i quattro tipi di processi sono code, eccetto l'output del lettore dello schermo. Se un output del lettore dello schermo viene inviato da un'applicazione mentre &ktts; sta pronunciando un altro output del lettore dello schermo, il messaggio pronunciato viene interrotto e perso. Tipi di filtri La prima cosa che devi sapere dei filtri è che non sono mai applicati all'output del lettore dello schermo. Sono applicati agli avvertimenti, ai messaggi, ai processi di testo e alle notifiche di &kde; (KNotify). Ci sono due tipi di filtri: i filtri ordinari e i filtri di rilevamento del limite delle frasi (RLF). Gli RLF spezzano il testo in frasi singole. Ciò permette a &ktts; di iniziare a parlare più velocemente perché deve sintetizzare solo la prima frase, non l'intero processo di testo. Ti permette anche di avanzare o riavvolgere per frasi nella scheda Processi, o per fermare o mettere in pausa i processi di testo quando il sintetizzatore vocale non supporta direttamente l'interruzione della pronuncia. I filtri ordinari elaborano il testo e lo passano al prossimo filtro. Attualmente ci sono tre tipi di filtri ordinari. Sostitutori di stringhe. Trasformatori &XML; Selettori dell'oratore. I filtri sono implementati usando un'architettura a plugin. Nel futuro, ci potrebbero essere altri tipi di filtri. I filtri sostitutori di stringhe sostituiscono pezzi di testo con altro testo. I pezzi sostituiti sono identificati o con parole o con espressioni regolari. &ktts; è equipaggiato con dei filtri predefiniti di sostituzione delle stringhe per pronunciare le abbreviazioni, le faccine come ":-)", o riformattare i messaggi di notifica da &konversation; o &kmail; in una forma più comprensibile. I trasformatori &XML; usano un file &XML; Style Language - Transforms (XSLT) per convertire &XML; da un formato a un altro. &ktts; ha un paio di file XSLT per convertire &XHTML; in SSML. I selettori degli oratori ti permettono di inviare i processi a un oratore in base ai contenuti del testo, o in base all'applicazione che li ha inviati a &ktts;. Per esempio, se hai configurato un oratore femminile nella scheda Oratori, puoi ridirezionare il testo proveniente da KSayIt a quell'oratore. Vedi . Ognuno di questi tipi di filtro ha delle regole configurabili per quando il filtro dovrebbe essere applicato al testo da pronunciare. Se il filtro determina che non dovrebbe essere applicato, il testo viene passato al prossimo filtro senza modifiche. Quando un processo di testo, un messaggio, un avvertimento o una notifica di &kde; viene inviato a &ktts;, passa attraverso ogni filtro abilitato che hai configurato nella schermata sotto. L'ordine è dal basso verso l'alto. Dopo essere passato attraverso ogni filtro ordinario elencato nella parte alta dello schermo, i processi di testo sono passati ai filtri di rilevazione dei limiti delle frasi (RLF). Le notifiche di &kde;, gli avvertimenti e i messaggi non passano mai dai filtri RLF. Al contrario dei filtri ordinari, il primo filtro RLF che effettua cambiamenti al testo blocca ogni filtraggio successivo. Configurare i filtri Per usare i filtri, fai clic sulla scheda Filtri in kttsmgr. Il gestore della pronuncia di &kde; (scheda Filtri). Il gestore della pronuncia di &kde; (scheda Filtri) Questo è l'elenco di filtri ordinari configurati. Se non è segnato, il filtro è inattivo e sarà saltato. I filtri sono applicati nell'ordine qui specificato, dall'alto in basso. Fai clic qui per aggiungere un nuovo filtro. Ti sarà chiesto il tipo di filtro da aggiungere. Dopo aver scelto il tipo, vedi le finestre di configurazione sotto. Fai clic qui per rimuovere un filtro. Fai clic qui per cambiare la configurazione di un filtro. Vedi le finestre di configurazione sotto. Fai clic su questi pulsanti per spostare un filtro in alto o in basso nell'elenco. Questi sono i filtri di rilevazione dei limiti delle frasi. Quando avvii per la prima volta &ktts;, il rilevatore standard dei limiti delle frasi viene configurato automaticamente per te. Puoi cambiare la configurazione di questo filtro, o aggiungere degli altri rilevatori di limiti delle frasi, ma suggeriamo ai principianti di non cambiarli. Questo pulsante a cascata ti permette di aggiungere, rimuovere, modificare o cambiare l'ordine dei filtri di rilevazione dei limiti delle frasi. Assicurati di fare clic qui, altrimenti le tue impostazioni non avranno effetto. Configurare i filtri di sostituzione delle stringhe Configuri i filtri di sostituzione delle stringhe dando un elenco di parole o espressioni regolari che devono essere sostituite. Quando nel testo vengono trovate le parole o le espressioni regolari corrispondenti, ciascuna viene sostituita con una stringa sostitutiva che fornisci tu. Le corrispondenze non distinguono le maiuscole. Sostituzione delle stringhe Sostituzione delle stringhe Inserisci un nome per il tuo filtro. Usa qualsiasi nome tu voglia che lo distingua da tutti gli altri. Questo è l'elenco di parole ed espressioni regolari. Il filtro cerca corrispondenze in ciascuna stringa nella colonna Corrispondi a, sostituendo le stringhe che corrispondono con la stringa nella colonna Sostituisci con. L'elenco è elaborato nell'ordine visualizzato, dall'alto in basso. Fai clic qui per aggiungere una parola o un'espressione regolare all'elenco. Fai clic qui per spostare la parola o l'espressione regolare attualmente evidenziata in alto o in basso nell'elenco. Fai clic per cambiare una parola o un'espressione regolare nell'elenco. Fai clic per rimuovere dall'elenco la parola o l'espressione regolare attualmente evidenziata. Usa questi pulsanti per caricare un elenco di parole o espressioni regolari da un file, salvare l'elenco attuale in un file, o svuotare l'intero elenco. Quando carichi da un file, gli elementi del file sono aggiunti all'elenco esistente. Se non è in bianco, il filtro sarà applicato solo se la lingua dell'oratore del processo corrisponde alla lingua che inserisci qui. Fai clic sul pulsante per visualizzare un elenco di lingue. Puoi selezionarne più d'una premendo &Ctrl; mentre fai clic. Se non è in bianco, il filtro sarà applicato solo se il testo viene da una delle applicazioni elencate. Potresti inserire più applicazioni separate da virgole. Per esempio: konversation,kmail Puoi conoscere l'ID dell'applicazione dei programmi in esecuzione usando il programma kdcop. Dovresti togliere i numeri &DCOP;. Per esempio, se &kdcop; mostrasse un'ID dell'applicazione kopete-3432, inseriresti semplicemente kopete. Il filtro di sostituzione delle stringhe sarà applicato al testo solo se tutte le condizioni non in bianco saranno soddisfatte nel riquadro Applica questo filtro quando. Se tutti i riquadri sono in bianco, il filtro sarà applicato a tutto il testo. Tutte le corrispondenze non distinguono le maiuscole. Quando cerca le corrispondenze delle parole, il filtro di sostituzione delle stringhe usa internamente un'espressione regolare nella forma \sparola\s. In altre parole, la parola deve avere dei limiti di parola (spazi) su entrambi i suoi lati. Una discussione su come scrivere le espressioni regolari è oltre l'ambito di questo manuale. Se avete installato l'editor di espressioni regolari di &kde;, è disponibile un pulsante sulle schermate Aggiungi o Modifica che ti aiuterà a costruire le espressioni regolari. L'editor di espressioni regolari di &kde; fa parte del pacchetto kdeutils. &ktts; ha alcuni file di elenchi di parole, incluso un elenco di faccine, come ":-)", alcune abbreviazioni usate tipicamente su IRC o applicazioni di messaggeria istantanea, e un elenco di altre abbreviazioni. C'è anche un elenco di caratteri speciali che la versione attuale della voce polacca di Festival non può gestire. Se sviluppi da te degli elenchi di parole utili, usa il pulsante Salva per salvarli in un file e inviarli alla squadra di &ktts; per includerli nella prossima versione. Configurare i filtri di trasformazione &XML; Il filtro di trasformazione &XML; usa dei file XSLT per trasformare &XML; da un formato a un altro. XSLT, &XML; Style Language - Transforms, è una lingua standard del W3C per effettuare queste trasformazioni. Può essere usata solo su &XML; correttamente formattato. Devi avere installato il programma xsltproc. Trasformatore &XML; Trasformatore &XML; Inserisci un nome per il tuo filtro. Usa qualsiasi nome tu voglia che lo distingua da tutti gli altri. Inserisci il percorso completo a un file XSLT che effettuerà la trasformazione. Specifica il percorso al programma xsltproc. Se xsltproc è nella tua variabile d'ambiente PATH, inserisci semplicemente xsltproc. Se non è in bianco, il filtro si applicherà solo se l'&XML; ha l'elemento radice specificato o una specificazione che comincia per la stringa inserita. Ciò distingue una forma di &XML; dall'altra. Per esempio, html nel riquadro DOCTYPE corrisponderà a ]]>. Se non è in bianco, il filtro sarà applicato solo se il testo viene da una delle applicazioni elencate. Potresti inserire più applicazioni separate da virgole. Per esempio: konversation,kmail Puoi conoscere l'ID dell'applicazione dei programmi in esecuzione usando il programma kdcop. Dovresti togliere i numeri &DCOP;. Per esempio, se &kdcop; mostrasse un'ID dell'applicazione kopete-3432, inseriresti semplicemente kopete. Il filtro di trasformazione &XML; sarà applicato al testo solo se l'elemento radice o il DOCTYPE corrispondono, e se l'ID dell'applicazione corrisponde nella casella Applica questo filtro quando. Se un elemento in questa casella è in bianco, non viene effettuato il controllo, quindi se tutte le caselle sono in bianco il filtro sarà applicato al testo. Tuttavia, dovresti riempire almeno una casella, perché molti processi di testo non saranno in formato &XML;. Configurare i filtri di selezione degli oratori I filtri di selezione degli oratori sono usati per indirizzare il testo a un oratore desiderato configurato nella scheda Oratore, o a qualsiasi oratore che abbia certi attributi. Per esempio, puoi specificare che il testo in arrivo da kmail sia pronunciato usando un oratore configurato con una voce femminile. Vedi . Appena prima che &ktts; cominci a inviare il testo a ciascun filtro, sceglie un oratore per pronunciare il testo. L'oratore è scelto in base agli attributi specificati dall'applicazione che ha inviato il testo a &ktts; e gli attributi degli oratori che hai configurato nella scheda Oratori. Il filtro di selezione degli oratori ti permette di cambiare l'impostazione dell'oratore selezionato. Selettore degli oratori Selettore degli oratori Inserisci un nome per il tuo filtro. Usa qualsiasi nome tu voglia che lo distingua da tutti gli altri. Se non è in bianco, il filtro sarà applicato solo se il testo contiene l'espressione regolare inserita. Se è installato, fai clic sul pulsante Sfoglia per avviare l'editor di espressioni regolari di &kde; per aiutarti a inserire l'espressione regolare. Per prestazioni migliori, prova ad "ancorare" l'espressione regolare all'inizio della stringa. In altre parole, avvia la tua espressione regolare con . Se non è in bianco, il filtro sarà applicato solo se il testo viene da una delle applicazioni elencate. Potresti inserire più applicazioni separate da virgole. Per esempio: konversation,kmail Puoi conoscere l'ID dell'applicazione dei programmi in esecuzione usando il programma kdcop. Dovresti togliere i numeri &DCOP;. Per esempio, se &kdcop; mostrasse un'ID dell'applicazione kopete-3432, inseriresti semplicemente kopete. Specifica qui gli attributi dell'oratore che preferisci pronunci il testo. Se il testo soddisfa le condizioni del filtro sopra, sarà scelto un oratore che corrisponda il più vicino possibile agli attributi che specifichi qui. Fai clic sul pulsante a destra per visualizzare la schermata Seleziona oratore. Vedi . Usa questi pulsanti per salvare le tue impostazioni del Selettore degli oratori, caricare le impostazioni da un file salvato, o azzerare tutte le impostazioni. Il filtro di selezione degli oratori sarà applicato al testo solo se tutte le condizioni non in bianco saranno soddisfatte nel riquadro Applica questo filtro quando. Devi riempire almeno uno dei riquadri. Il modo più facile di imparare a configurare i selettori degli oratori è sperimentare. Disattiva il selettore degli oratori e inserisci del testo. Nella scheda Processi, nota l'oratore che &ktts; sceglie. Fai clic sul pulsante Cambia oratore, inserisci degli attributi, e prova a vedere come la scelta ne viene influenzata. Ovviamente devi avere più di un oratore configurato affinché il selettore degli oratori possa fare qualcosa. Configurare i filtri di rilevamento dei limiti delle frasi I filtri di rilevamento dei limiti delle frasi (RLF) dividono il testo in singole frasi. Questo è importante perché permette a &ktts; di iniziare a parlare più velocemente perché deve sintetizzare solo la prima frase, invece che tutto il blocco di testo, che potrebbe essere molto lungo, e ti permette di riavvolgere e avanzare per frasi nella scheda Processi, e ti permette di mettere in pausa o fermare i processi di testo nella scheda Processi anche se il sintetizzatore vocale non può essere fermato. Per queste ragioni, il filtro standard di rilevamento dei limiti delle frasi è configurato automaticamente la prima volta che avvii kttsmgr e non può essere disattivato (anche se puoi rimuoverlo). Ti suggeriamo di non modificare questo filtro a meno che tu sappia cosa stai facendo. Puoi, comunque, aggiungere altri filtri RLF per risolvere certi problemi. Per esempio, nel febbraio del 2005, la voce polacca di Festival ha la fastidiosa abitudine di pronunciare la punteggiatura delle frasi. Per esempio, pronuncerà i punti alla fine di ogni frase. Non puoi risolvere questo problema creando un filtro di sostituzione di stringhe per rimuovere la punteggiatura delle frasi, perché farlo impedirebbe all'RLF standard di riconoscere le frasi. Invece, puoi creare una versione modificata dell'RLF standard che riconosce le frasi e simultaneamente rimuove la punteggiatura delle frasi. Per farlo, aggiungi un file RLF e usa il pulsante Carica per caricare il file polish_festival_sbdrc che è compreso in &ktts;. I filtri RLF funzionano facendo corrispondere un'espressione regolare e inserendo tabulatori (decimale 8) ai limiti delle frasi. Tutti i caratteri di tabulazione sono automaticamente eliminati dal testo prima dell'inizio del filtraggio. Nota che l'RLF standard mantiene la punteggiatura della frase. I filtri RLF non sono mai applicati ai messaggi di notifica di &kde; (knotify), agli avvertimenti, ai messaggi o all'output di lettura a schermo. Se rimuovi per sbaglio il filtro standard di rilevamento dei limiti delle frasi, puoi riaverlo caricando il file standard_sbdrc, che è incluso in &ktts;. Selezionare gli oratori (Avanzato) Puoi configurare qualsiasi numero di oratori nella scheda Oratori. Vedi . Quando le applicazioni inviano del testo a &ktts;, possono specificare gli attributi di un oratore desiderato per pronunciare il testo. &ktts; sceglierà l'oratore più simile tra gli oratori che hai configurato per soddisfare la richiesta dell'applicazione. Per esempio, un'applicazione potrebbe chiedere che il testo venga pronunciato da una voce femminile inglese. Se hai configurato un oratore con la lingua inglese e di genere femminile, sarà usato quello. Se hai configurato solo oratori inglesi maschili, sarà usato uno di questi. Se un'applicazione non specifica degli attributi, sarà usato l'oratore predefinito (quello in cima all'elenco) della scheda Oratori. Quando le applicazioni specificano gli attributi dell'oratore desiderato, possono indicare che certi attributi sono "preferiti" rispetto ad altri. Per esempio, un'applicazione potrebbe specificare di volere una voce forte e femminile per pronunciare il testo, e che l'attributo del volume sia "preferito" rispetto al genere femminile. Se hai configurato un oratore femminile debole e un oratore maschile forte, &ktts; sceglierà il secondo per la pronuncia. Siccome la lingua è un parametro critico per rendere comprensibile il parlato, essa è sempre un attributo preferito. Usando la schermata Seleziona oratore puoi modificare le impostazioni degli oratori per le applicazioni. La schermata è visualizzata quando fai clic sul pulsante Cambia oratore nella scheda Processi, o quando fai clic sul pulsante Oratore nella finestra Configurazione dei filtri per un filtro di scelta degli oratori, o quando fai clic sul pulsante Oratore nella scheda Notifiche. Seleziona l'oratore Seleziona l'oratore La schermata offre tre metodi di specificare gli attributi dell'oratore desiderato: Usa l'oratore predefinito (quello più in alto nella scheda Oratori). Vale a dire, non sono specificati degli attributi per gli oratori. Usa l'oratore più simile che abbia uno o più attributi specificati. Usa l'oratore più simile che abbia tutti gli attributi di un oratore configurato. Se non elimini o modifichi le impostazioni dell'oratore, &ktts; sceglierà quel particolare oratore. Se elimini o modifichi le impostazioni dell'oratore, &ktts; sceglierà l'oratore più simile che abbia gli attributi originali dell'oratore. Scegli il metodo per inserire gli attributi desiderati dell'oratore facendo clic su uno di questi pulsanti a scelta singola. Scegli qui gli attributi dell'oratore desiderato. Se un particolare attributo non ti interessa, lascialo in bianco. Segna questa casella se vuoi che l'attributo sia "preferito" rispetto ad altri. Puoi segnare più di una casella. Siccome la lingua è un fattore critico nel rendere comprensibile il parlato, essa è sempre un attributo preferito. È raro usare questo attributo. L'unica volta che potresti specificare un attributo di lingua è quando sai che un'applicazione specifica invia il testo in una lingua diversa da quella del tuo desktop. Questo è un elenco degli oratori attualmente configurati in &ktts;. Scegliendone uno, in pratica, stai scegliendo tutti gli attributi dell'oratore. Se quell'oratore è ancora configurato quando il testo viene inviato, ci sarà una corrispondenza esatta, e sarà scelto quell'oratore. Tuttavia, se in seguito lo elimini, o ne modifichi le impostazioni, potrebbe non essere più l'oratore scelto. Sarà scelto l'oratore che si avvicina di più agli attributi originali. L'attributo Lingua è speciale perché il testo sarà probabilmente incomprensibile se verrà pronunciato da un oratore che parla una lingua diversa dal testo. Quindi, la lingua è automaticamente un attributo "preferito". Se specifichi una lingua, essa soprassederà la lingua scelta, ma se lasci in bianco, sarà usata l'attuale impostazione della lingua. Se l'applicazione che ha inviato il testo a &ktts; non ha specificato una lingua, &ktts; assegna la lingua dell'oratore più in alto che hai configurato nella scheda Oratori. Insomma, si assume che l'oratore più in alto parli la lingua del tuo desktop. Per pulire tutti gli attributi nella sezione Usa l'oratore più simile che abbia, fai prima clic sul pulsante a scelta singola Usa oratore predefinito, quindi fai clic sul pulsante a scelta singola Usa l'oratore più simile che abbia. Riferimento dei comandi DA FARE Guida per lo sviluppatore a &ktts; &ktts; ha due interfacce dell'applicazione per programmatori (API): L'API di pronuncia di &kde;, usata dai programmatori di applicazioni per dare alle loro applicazioni delle capacità TTS. Le applicazioni comunicano con KTTSD attraverso &DCOP;. L'API dei plugin di KTTSD, usata per aggiungere plugin di sintesi vocale a KTTSD in modo che &ktts; funzioni con un nuovo motore di sintesi vocale. La sezione seguente dà una breve descrizione dell'interfaccia &DCOP; dell'API di pronuncia di &kde;. La documentazione completa per entrambe le API è disponibile in rete sul sito Web dell'accessibilità di &kde; (http://accessibility.kde.org). L'interfaccia &DCOP; di &ktts; Le applicazioni comunicano le richieste di servizi di pronuncia attraverso l'oggetto KSpeech dell'interfaccia &DCOP; di &kde; al programma kttsd. Inserisci i comandi seguenti in una &konsole;. Se KTTSD non è ancora in esecuzione kttsd Per mettere in coda un processo di testo da pronunciare dcop kttsd KSpeech setText "testo" "oratore" dove testo è il testo da pronunciare, e oratore è un codice di una lingua come en, it, eccetera. Questo comando non pronuncia il testo; invece mette in coda un processo di testo perché sia pronunciato. Esempio. dcop kttsd KSpeech setText "Questa è una prova." "it" Per pronunciare l'ultimo processo di testo in coda dcop kttsd KSpeech startText 0 In questo caso 0 si riferisce all'ultimo processo di testo in coda. Puoi anche specificare un numero di processo specifico (se non viene dato nessun numero di processo, è richiesto uno 0). Per fermare il processo di testo attualmente in fase di pronuncia dcop kttsd KSpeech stopText 0 A seconda del plugin vocale usato, la pronuncia potrebbe non fermarsi immediatamente. Ci sono molti altri comandi che si possono inviare. Per vedere un elenco dei comandi possibili, dcop kttsd KSpeech o leggi la API di pronuncia di &kde; in rete. Domande e risposte &reporting.bugs; &updating.documentation; kttsmgr va immediatamente in crash quando l'avvio. L'ho compilato con supporto per il debug e non ottengo neanche un backtrace. GStreamer è andato in crash e si è portato dietro &ktts;. Molto probabilmente devi "registrare" GStreamer. Per GStreamer 0.8x, il comando è gst-register-0.8. Se ciò non risolve il problema, potresti aver installato una versione di GStreamer non compatibile. Puoi provare ad aggiornarla o a disinstallare GStreamer. L'output audio ALSA non funziona se sto ascoltando musica in un'altra applicazione allo stesso tempo. Quando metto in pausa un processo di testo, &ktts; si blocca. Noto un "impossibile aprire PCM" nell'output di &konsole;. Hai il problema di contenimento del dispositivo ALSA, che impedisce di aprire più di un dispositivo PCM allo stesso tempo. Vedi il sito Web di ALSA (dmix) per le soluzioni possibili: www.alsa-project.org. Devo ripartire da zero. Come faccio fermare completamente &ktts;? Inserisci i comandi seguenti in una &konsole;: killall kttsd killall kttsmgr Come posso vedere l'output di debug di kttsd? Apri due finestre di &konsole;. Prima avvia kttsd nella prima, quindi avvia kttsmgr nella seconda. Ho una voce di Festival aggiuntiva che ho scaricato da Internet. L'ho installata, e la posso usare in Festival, ma non appare in kttsmgr. Modifica il file $KDEHOME/share/apps/kttsd/festivalint/voices per aggiungere la nuova voce. Le altre voci possono essere usate come guida. Se aggiungi correttamente una voce, per piacere invia una correzione agli sviluppatori assieme all'&URL; da dove hai ottenuto il file della voce. Nessuno dei sintetizzatori vocali supportati supporta la lingua di cui ho bisogno. Dove posso trovare un sintetizzatore per la mia lingua? Google(tm) ti è alleato. Anche questo collegamento potrebbe esserti d'aiuto. Se trovi un motore di sintesi gratuito che supporti la lingua che desideri, e vuoi aggiungerne il supporto a &ktts;, per piacere contatta la squadra di sviluppo. I motori liberi sono particolarmente i benvenuti. Se conosci di un sintetizzatore commerciale, forse puoi persuaderne il distributore a donare una copia gratuita alla squadra di sviluppo di &ktts;. Nel frattempo, potresti essere in grado di far funzionare il sintetizzatore usando il plugin Comando. Vedi . &ktts; parla troppo lentamente. Come lo posso far accelerare? C'è un'impostazione di Velocità nella scheda Audio. Perché funzioni, devi aver installato il programma sox e deve essere disponibile nella variabile d'ambiente PATH. Alcuni plugin di sintesi, come Festival Interactive, forniscono un'impostazione di Velocità all'impostazione dell'oratore nella finestra di configurazione. A seconda della voce usata, potrebbe essere abilitato o meno. OK, funziona per alcune cose, ma le pagine Web sono ancora pronunciate troppo lentamente. Le impostazioni di velocità sono ignorate quando &ktts; pronuncia l'&HTML;. Ciò perché &HTML; viene convertito in SSML, che ha le sue tag di velocità. Disabilita il filtro di trasformazione &XML; per &HTML; (vedi ), o, se hai coraggio, modifica il file .xsl nel filtro di trasformazione da &HTML; a SSML, e aumenta la velocità di pronuncia predefinita. Non riesco a far pronunciare le pagine Web con una voce femminile. Ho un oratore femminile configurato in Festival, ma &ktts; pronuncia le pagine Web sempre con una voce maschile. Fino a Festival 1.95 beta, il tag SABLE GENDER pare non funzionare. Per evitare che Festival produca errori, il file .xsl da SSML a SABLE rimuove i tag relativi al genere. Lo stesso si applica anche ai tag della voce. Ho configurato il plugin di trasformazione &XML; per &HTML;, ma le pagine Web non vengono pronunciate per niente usando il plugin di Festival. A causa di un errore in Festival 1.95 beta, devi installare la voce rab_diphone (maschio britannico) affinché SABLE funzioni, anche se non usi quella voce per pronunciare le pagine Web. Inoltre, assicurati che il programma xsltproc sia installato e nella variabile d'ambiente PATH. Certi caratteri o segni di punteggiatura sembrano produrre errori nel sintetizzatore, facendogli saltare intere frasi, o pronunciando cose incomprensibili. Cosa posso fare? Primo, assicurati che l'opzione Codifica dei caratteri nella finestra di configurazione dell'oratore sia correttamente impostata per la lingua. Se certe parole o caratteri stanno causando dei problemi, un filtro di sostituzione delle stringhe potrebbe aiutare. Se certi caratteri di punteggiatura confondono il sintetizzatore, dovrai configurare un filtro di rilevamento dei limiti delle frasi. Vedi . Ho aggiunto un filtro di sostituzione delle stringhe e ora &ktts; non mi permette di riavvolgere o avanzare per frasi. Nella scheda Processi sostiene che ogni processo ha una sola frase. Cos'ho sbagliato? Non devi filtrare i caratteri di punteggiatura (punto, punto di domanda, punto esclamativo, due punti e punto e virgola). Per questi caratteri, usa invece un filtro di rilevamento dei limiti delle frasi. Riconoscimenti e licenza &ktts; Copyright © del programma 2002 José Pablo Ezequiel "Pupeno" Fernández pupeno@kde.org Attuale responsabile: Gary Cramblitt garycramblitt@comcast.net Hanno contribuito: Olaf Schmidt ojschmidt@kde.org Gunnar Schmi Dt gunnar@schmi-dt.de Paul Giannaros ceruleanblaze@gmail.com Copyright © della documentazione 2004 Gary R. Cramblitt garycramblitt@comcast.net Federico Zenithfederico.zenith@member.fsf.org &underFDL; &underGPL; I motori di sintesi vocale usati da &ktts; hanno licenze proprie. Vedi la documentazione o il sito Web di ogni motore per i dettagli. Alcune voci hanno anche una licenza propria. Installazione Come ottenere &ktts; &install.intro.documentation; (In futuro) Comando di installazione sotto Debian: apt-get install kdeaccessibility Troverai dei collegamenti a pacchetti sorgente e binari al sito Web dell'Accessibilità di &kde; (http://accessibility.kde.org). Se hai accesso al deposito del codice di &kde;, puoi scaricare &ktts; ritirando il modulo kdeaccessibility. &ktts; si troverà nella cartella kttsd. Puoi anche scaricare un file compresso del codice sorgente di kdeaccessibility da ftp://ftp.kde.org/pub/kde/ Requisiti Requisiti obbligatori: &kde; versione 3.2 o successiva. Un motore di sintesi vocale. Sono attualmente supportati i motori e le lingue seguenti. Festival Inglese americano, inglese britannico, spagnolo, tedesco, finlandese, ceco, polacco, russo, italiano, francese canadese, Kiswahili, Zulù e Ibibio Festival Lite (flite) Inglese Hadifix (&mbrola; e txt2pho) Tedesco, ungherese Epos Ceco, slovacco FreeTTS Inglese Funziona anche con qualsiasi motore di sintesi che possa essere eseguito da un comando in &konsole;. L'elenco di lingue sopra potrebbe non essere completo o aggiornato. Controlla le specifiche di ogni motore per un elenco completo di lingue supportate. Controlla anche il sito Web di &ktts; per maggiori informazioni che potrebbero non essere state incluse in questo manuale. &ktts; usa un'architettura flessibile a plugin per i motori di sintesi vocale. Se vuoi migliorare &ktts; per supportare un altro motore, contatta la squadra di sviluppo. Vedi per istruzioni specifiche per ciascuno di questi motori. Almeno uno dei seguenti sottosistemi audio: Sistema sonoro &arts; di &kde;. &arts; è normalmente installato insieme a &kde;. ALSA (Advanced &Linux; Sound Architecture, architettura sonora avanzata di &Linux;). ALSA viene installata con la maggior parte dei sistemi &Linux;. (www.alsa-project.org) GStreamer versione 0.8.7 o successiva. Nota: assicurati di registrare i plugin di GStreamer eseguendo il comando gst-register prima di usare GStreamer in &ktts;. (http://gstreamer.freedesktop.org) Libreria aKode. aKode è una libreria di decodifica che fa parte di &kde;. Il progetto &kde; ha in programma di eliminare &arts; a partire dalla versione 4. Alcuni utenti hanno avuto problemi di contesa dei dispositivi con ALSA. Se il tuo sistema ha questo problema, non potrai ascoltare musica durante la pronuncia. &ktts; si bloccherà se metti in pausa un processo di testo e ne avvii un altro. Vedi il sito Web di ALSA (dmix) per le soluzioni possibili. Alla data di luglio 2005, aKode non supporta una vera funzionalità di pausa. Quando metti in pausa un processo di testo in &ktts;, si finirà di pronunciare la frase attuale. Componenti opzionali: Il programma audio sox è necessario per regolare la velocità di pronuncia generale, ma non è indispensabile. Gli utenti di Debian possono installare sox con il comando apt-get install sox. Sox è incluso sulla maggior parte dei CD delle distribuzioni &Linux;. Il programma xsltproc è necessario per il supporto SSML e per il filtro di trasformazione &XML;, ma non è indispensabile. Gli utenti Debian possono installare xsltproc con il comando apt-get install xsltproc. Compilazione e installazione Per compilare &ktts;, devi avere una copia recente (&kde; 3.4 o superiore) dei file di sviluppo di &kde;, inclusi kdelibs e aRts. Se hai scaricato &ktts; come un file compresso, accedi come utente normale e scompatta il file in una cartella adatta, passa a quella cartella, e inserisci i comandi seguenti. ./configure make Sono disponibili le seguenti opzioni per configure: Opzione predefinita Descrizione Alternativa --with-arts Compila il plugin audio per aRts. --without-arts --with-alsa=check Compila il plugin audio per ALSA. --with-alsa=no --with-gstreamer=no Non compila il plugin audio per GStreamer. --with-gstreamer=check --with-akode=no Non compila il plugin audio per aKode. --with-akode=check In &kde; 4, il plugin &arts; probabilmente sarà rimosso, o almeno non compilato come impostazione predefinita. I seguenti sintetizzatori vocali come impostazione predefinita sono compilati. Alcuni di essi dipendono, solo in esecuzione, da software non libero (non libero secondo le linee guida di Debian). La colonna "Opzione di configurazione per non compilare" mostra il comando di configurazione per non compilare il plugin: Sintetizzatore Licenza Opzione di configurazione per non compilare Festivalliberi--disable-kttsd-festivalint Festival Liteliberi--disable-kttsd-flite Eposliberi--disable-kttsd-epos Comandoliberi--disable-kttsd-command Hadifixnon liberi--disable-kttsd-hadifix FreeTTSnon liberi--disable-kttsd-freetts Come impostazione predefinita, i comandi sopra installeranno &ktts; in /opt/kde3. Se questa cartella non è nel tuo percorso $KDEDIRS, puoi aggiungere un'opzione --prefix=cartella. Per esempio, ./configure --prefix=/usr/local make Sui sistemi Debian, /usr/local è il posto normale per installare applicazioni compilate dal codice sorgente. Accedi come root e installa &ktts; compilato usando i comandi seguenti. su make install Se hai scaricato il sorgente di &ktts; dal modulo kdeaccessibility del deposito del codice, o hai scaricato il file compresso della notte, usa i comandi seguenti per compilare e installare. cd kdeaccessibility echo kttsd >inst-apps make -f Makefile.cvs ./configure cd kttsd make su make install Configurazione Assicurati che il tuo motore di sintesi vocale sia in funzione prima di usare &ktts;. Segui le istruzioni allegate al motore. In alcuni casi, potresti dover concedere accesso in scrittura al dispositivo audio. chmod a+rw /dev/dsp* Uso con Festival (Interattivo) Festival è uno dei migliori motori TTS gratuiti e liberi disponibili. La qualità delle voci è generalmente buona e ci sono un bel po' di lingue e voci supportate. Di molte voci puoi controllare il volume, la velocità della pronuncia generata, e il tono da &ktts;. Nome del sintetizzatore Festival Interattivo &URL;: http://www.cstr.ed.ac.uk/projects/festival/ Comando di installazione su Debian: apt-get install festival Devi installare almeno una lingua. Segui le istruzioni fornite con Festival. Se vuoi pronunciare delle pagine Web, devi installare la voce rab_diphone (maschio britannico). Sono disponibili voci inglesi aggiuntive per Festival a http://hts.ics.nitech.ac.jp/. Voci spagnole, inglesi e tedesche sono disponibili a http://cslu.cse.ogi.edu/tts/download/ Devi compilare un modulo aggiuntivo per queste voci; quindi, devi avere il codice sorgente di Festival. Le voci tedesche hanno una distribuzione limitata. Una voce maschile finlandese è disponibile a http://www.ling.helsinki.fi/suopuhe/download/. Una voce maschile polacca è disponibile a http://www.artegence.com/download/voicexml/speech/festival_polish_voice.tgz. Una voce maschile russa è disponibile a http://nshmyrev.narod.ru/festival/festival.html Devi avere Festival 1.95 beta o successivo per usare questa voce. La voce è ancora in fase di sviluppo precoce. Scompatta in festival/lib/voices/russian/. Quando configuri l'oratore russo, il codice della voce è msu_ru_nsh_diphone. Assicurati di selezionare una codifica cirillica a 8 bit, come KOI8-R. Le voci italiane per Festival 1.95 beta sono disponibili a http://www.csrf.pd.cnr.it/TTS/It-FESTIVAL-download.htm. Se ottieni degli errori CRC durante la decompressione, prova a scaricare di nuovo. Le voci kiswahili, zulù, e ibibio per Festival 1.95 beta sono disponibili a http://www.llsti.org/. Sfortunatamente, la voce hindi lì disponibile non funzionerà con &ktts;. Delle voci commerciali, inclusa una voce francese canadese, possono essere acquistate dalla Cepstral LLC, a http://www.cepstral.com/ Le domande ricorrenti sulla loro pagina di supporto contengono informazioni sull'uso delle loro voci in Festival. Festival è tipicamente incluso nelle distribuzioni di &Linux;. Controlla i CD della tua distribuzione per vedere se è incluso. Quando usi le lingue polacca, ungherese o ceca, assicurati che l'opzione Codifica sia impostata a ISO 8859-2. Quando usi la voce russa, assicurati che l'opzione Codifica sia impostata a una codifica cirillica a 8 bit, come KOI8-R. Usare Festival con &mbrola; Festival può essere usato in combinazione con il sintetizzatore &mbrola;. In questa modalità, Festival fa l'analisi lessicale e &mbrola; produce l'audio. Il file binario e i file delle voci di &mbrola; si possono scaricare da http://festvox.org/mbrola/. Segui le istruzioni nel file readme.txt fornito con il pacchetto scaricato. Nota che &mbrola; non è un sistema di pronuncia completo. &mbrola; sintetizza la pronuncia da file di difoni. Devi avere dei programmi aggiuntivi che producano i difoni. Quando è insieme a Festival, Festival produce i difoni necessari a &mbrola;. Si può usare anche txt2pho per produrre difoni da del testo tedesco. Vedi per maggiori informazioni. Ci sono tre metodi di combinare Festival e &mbrola;. Pacchetti &mbrola;. Al momento della scrittura di questo manuale, questo metodo era limitato alle voci inglesi. IMS German Festival. Festival-Czech. Usare Festival con i pacchetti &mbrola; In questo metodo, viene aggiunto a Festival del codice di impacchettamento aggiuntivo per abilitare la sintesi vocale tramite i file vocali di &mbrola;. Nota che i file vocali di &mbrola; non sono installati nell'albero di cartelle di &mbrola;. Invece, sono installati nell'albero festival/lib/. Per istruzioni, vedi http://www.cstr.ed.ac.uk/projects/festival/mbrola.html Usare IMS German Festival IMS German Festival è una versione modificata di Festival che usa le voci tedesche di &mbrola;. Funziona sia con Festival versione 1.4.1 che con Festival 2.0 (1.95 beta). Installa prima Festival e &mbrola;, se non l'hai già fatto. Poi, scarica IMS German Festival, da http://www.ims.uni-stuttgart.de/phonetik/synthesis/festival_opensource.html. Segui le istruzioni nel file README fornito con i file scaricati (nota, se usi insieme a Festival 2.0, che non è necessario applicare il file fixes, ma devi ancora ricompilare Festival). Infine, aggiungi le seguenti righe al file festival/lib/siteinit.scm. (voice-location "german_de1_os" "/usr/local/mbrola/de1" "German Female, IMS Festival de1") (voice-location "german_de2_os" "/usr/local/mbrola/de2" "German Male, IMS Festival de2") (voice-location "german_de3_os" "/usr/local/mbrola/de3" "German Female, IMS Festival de3") appena sopra la riga che dice (provide 'siteinit) Su alcuni sistemi, il file che modifichi è /etc/festival.scm. Aggiungi solo le righe che corrispondono alle voci tedesche che hai installato. Sostituisci il percorso corretto al posto di /usr/local/mbrola/. Nota anche che (al momento della scrittura) IMS German Festival non funziona con le voci tedesche de4, de5 e de6. Usare Festival-Czech Questo metodo usa del codice speciale per abilitare la sintesi vocale usando Festival con una voce &mbrola; ceca. Per installarlo, prima scaricalo e installa Festival e &mbrola; e assicurati che siano funzionanti. Poi, scarica Festival-Czech da http://www.freebsoft.org/festival-czech Nelle procedure seguenti sostituisci i giusti percorsi delle cartelle secondo la necessità. Scompatta il file scaricato in una cartella adatta e crea il lessico. L'eseguibile di Festival deve essere nella tua variabile d'ambiente PATH. cd /usr/local tar xvfz festival-czech.tar.gz cd festival-czech make Scarica il file vocale cz2 dal sito Web di &mbrola;, e scompattalo nella cartella di &mbrola;. cd /usr/local/mbrola mkdir cz2 cd cz2 unzip cz2-001009.zip Aggiungi le righe seguenti nel file festival/lib/siteinit.scm. (set! czech-lexicon-file "/usr/local/festival-czech/czech-lexicon.out") (set! load-path (cons "/usr/local/festival-czech" load-path)) (require 'czech) (set! czech-mbrola_database "/usr/local/mbrola/cz2/cz2") (set! mbrola_progname "/usr/local/mbrola/mbrola") (voice-location "czech_mbrola_cz2" "/usr/local/mbrola/cz2" "Czech Male, MBROLA") (require 'czech-mbrola) appena sopra la riga che dice (provide 'siteinit) Su alcuni sistemi, il file che modifichi è /etc/festival.scm. Usare con Festival Lite (flite) Festival Lite è un motore gratuito e libero che attualmente supporta un numero limitato di voci e lingue. Pesa poco, ma sacrifica un po' la qualità della voce. Non puoi controllare il tono, il volume o la velocità di questo motore da &ktts;. Nome del sintetizzatore: Festival Lite (flite) &URL;: http://www.speech.cs.cmu.edu/flite/index.html Comando di installazione su Debian: apt-get install flite flite è tipicamente incluso nelle distribuzioni &Linux;. Controlla i CD della tua distribuzione per vedere se è incluso. Compila e installa flite seguendo le istruzioni nel file README allegato. Usare con Hadifix (&mbrola; e txt2pho) Hadifix è un motore di sintesi a doppio stadio basato sui difoni. Il programma txt2pho converte il testo in difoni e il motore &mbrola; sintetizza i difoni in suono. La qualità della voce è buona, ma il supporto linguistico è attualmente piuttosto limitato. Puoi controllare la voce, il tono, la velocità e il volume da kttmsgr. Nome del sintetizzatore: Hadifix &URL;: vedi sotto Comando di installazione su Debian: nessuno Se non hai già installato Hadifix, fai così: Scarica &mbrola; da http://festvox.org/mbrola/. Installa &mbrola; nella cartella /usr/local/mbrola. Scarica almeno un file di lingua tedesca dal sito di &mbrola;. Scompatta nella cartella /usr/local/mbrola. Scarica txt2pho da http://www.ikp.uni-bonn.de/dt/forsch/phonetik/hadifix/HADIFIXforMBROLA.html. Scompatta txt2pho in /usr/local/txt2pho. Modifica il file txt2phorc, inserendo i percorsi giusti ai dati. Copia txt2phorc in ~/.txt2phorc o in /etc/txt2pho. Nota che elimini l'"rc" nel nome del file. In kttsmgr, scegli la lingua tedesca (de), e aggiungi Hadifix. Sulla schermata Configurazione degli oratori, configura una voce e i percorsi a &mbrola; e txt2pho. Fai clic sul pulsante Prova per una prova. Un'implementazione ungherese di &mbrola; e txt2pho è disponibile a http://tkltrans.sourceforge.net/. Usare con Epos Epos è un motore gratuito e libero per ceco e slovacco. È leggero, ma sacrifica un po' la qualità della voce. Non puoi controllarne il volume da &ktts;. Nome del sintetizzatore: Sistema di sintesi TTS Epos &URL;: http://epos.ure.cas.cz/ Comando di installazione su Debian: apt-get install epos Avvia kttsmgr. Sulla scheda Oratori, fai clic sul pulsante Aggiungi. Scegli la lingua ceca o slovacca e il Sistema di sintesi TTS Epos. Se l'eseguibile del server e del client Epos non sono nella tua variabile d'ambiente PATH, specifica i percorsi a questi eseguibili nella schermata Configura oratore. Le caselle delle opzioni ti permettono di passare opzioni aggiuntive al server e al client. In una &konsole;, scrivi epos -h o say -h per maggiori informazioni. Usare con FreeTTS FreeTTS è un motore vocale gratuito e libero scritto in &Java;, il che vuol dire che devi avere il software della macchina virtuale di &Java; installato sul tuo sistema per usarlo. Ha attualmente supporto limitato per voci e lingue. Non puoi controllare il tono, il volume o la velocità di questo motore da &ktts;. Nome del sintetizzatore: FreeTTS &URL;: http://sourceforge.net/projects/freetts/ Comando di installazione su Debian: nessuno Usare il plugin Comando Il plugin Comando ti permette di usare &ktts; con qualsiasi motore di sintesi vocale che possa essere eseguito come un comando in una &konsole;. Nome del sintetizzatore: Comando &URL;: nessuna Comando di installazione su Debian: nessuno In teoria, dovresti usare un comando che sintetizzi in un file audio temporaneo (wav), piuttosto che inviare la voce direttamente al dispositivo audio. Se il motore di sintesi vocale richiede che il testo sia codificato diversamente dall'impostazione della codifica del tuo desktop, devi usare il parametro %fper passare il testo al motore. &ktts; codificherà il testo nell'impostazione che specifichi quando scriverà il testo nel file temporaneo. Se provi a passare del testo dalla riga di comando usando il parametro %t, sarà codificato con l'impostazione locale del tuo desktop. Puoi anche usare l'opzione Invia i dati come ingresso standard per risolvere questo problema, se il motore accetta input da stdin. Per esempio, ecco un comando di prova per inviare del testo polacco a festival usando la codifica ISO 8859-2 e rimuovendo i segni di punteggiatura non pronunciabili. cat %f | tr '(){}[]"' ' ' | festival --tts --language polish &documentation.index;