Copyright © 2004-2005 Gary R. Cramblitt
Härmed ges tillåtelse att kopiera, distribuera och/eller ändra detta dokument under villkoren i GNU Free Documentation License, Version 1.1 eller någon senare version publicerad av Free Software Foundation; utan invarianta avsnitt, utan framsidestexter och utan baksidestexter. En kopia av licensen inkluderas i avsnittet som heter "GNU Free Documentation License".
KTTS, KDE:s text-till-tal system. är en insticksprogrambaserad tjänst som låter vilket KDE-program (eller annat program) som helst använda tal via ett DCOP-gränssnitt.
KTTS är avsedd att vara implementeringen av KDE:s text-till-tal programmeringsgränssnitt.
Innehållsförteckning
KTTS är ett delsystem i KDE för att skapa text-till-tal (TTS). Det tillhandahåller ett gemensamt programmeringsgränssnitt för KDE-programmerare som ger möjlighet att använda text-till-tal i sina program. Det tillhandahåller också några trevliga funktioner för slutanvändare.
Användarfunktioner:
Läs upp innehållet i en textfil.
Läs upp KDE:s meddelandehändelser (Knotify).
Läs upp hela eller delar av texten på en webbsida i Konqueror.
Läs upp hela eller delar av texten i Kate texteditorn, inklusive fall då Kate är inbäddad i ett annat KDE-program.
Lång text tolkas till meningar. Användaren kan gå bakåt en mening eller ett stycke, läsa upp igen, göra paus och stoppa uppläsning.
Ljudutmatning via aRts, ALSA, Gstreamer (version 0.8.7 eller senare) eller aKode.
Filter som kan anpassas av användaren för att ersätta feluttalade ord, välja talsyntes och omvandla XHTML- eller XML-dokument.
Programmeringsfunktioner:
Prioriteringssystem för skärmläsningsutmatning, varningar och meddelanden, medan uppläsning av vanlig text pågår.
Arkitektur baserad på insticksprogram med stöd för ett stort antal olika talsyntesprogram och drivrutiner.
Tillåter att skapa tal från kommandoraden (eller via skalskript) med KDE:s DCOP-verktyg.
Tillhandahåller en lättviktig och lättanvänt gränssnitt för program att skapa talad utmatning.
Program behöver inte bekymra sig om konflikt över uppläsningsenheten.
FRAMTIDA: Tillhandahåller stöd för talmarkeringsspråk, såsom VoiceXML, Sable, Java™ Speech Markup Language (JSML), och Speech Markup Meta-language (SMML).
FRAMTIDA: Tillhandahålla begränsat stöd för inbäddade talmarkörer.
Asynkront för att förhindra att systemet blockeras.
KTTS består i själva verket av flera program:
KDE:s text-till-tal demon, som är ett program utan grafiskt gränssnitt som tillhandahåller text-till-tal tjänster till program via DCOP.
Ett grafiskt program för att anpassa och styra kttsd. Programmet kttsmgr är placerad i systembrickan.
Ett insticksprogram för webbläsaren Konqueror som tillåter att hela eller delar av texten på en webbsida läses upp.
Ett insticksprogram för texteditorn Kate som tillåter att hela eller delar av en textfil läses upp.
Förutom KDE:s feldatabas Bugzilla (http://bugs.kde.org/), äger diskussioner om KTTS för närvarande rum på e-postlistan kde-accessibility. Prenumerera på https://mail.kde.org/mailman/listinfo/kde-accessibility. Utvecklare finns också på IRC (irc.kde.org, kanalen #kde-accessibility).
Innan du kan använda KTTS måste du installera minst ett talsyntesprogram och försäkra dig om att det fungerar. Se Appendix A, Installation.
För att starta KTTS-systemet, skriv in följande kommando i en terminal
kttsmgr
eller klicka på kttsmgr i KDE:s meny.
Om det är första gången kttsmgr körs, eller om du ännu inte har ställt in några talare, visas sidan Talare. Se “Anpassa insticksprogram för syntes (talare)”. Om du redan har ställt in minst en talare, visas sidan Allmänt. Se “Starta KTTSD och ställa in allmänna alternativ”.
De flesta program för text-till-talsyntes (TTS) erbjuder flera språk och röster, och kan erbjuda flera uppläsare med olika kön, volym och hastigheter. Du kan ställa in mer än en instans av syntesen. Varje kombination av språk, syntes, röst, kön, volym och hastighet kallas en talare. Du måste ställa in minst en talare innan du kan starta KTTS och börja läsa upp text.
Flera talare med samma syntesprogram liknar flera skrivarköer för en ensam fysisk skrivare.
När program skickar text till KTTS, kan de ange egenskaper hos talaren de föredrar för att utföra syntesen. Ett program kan till exempel begära en engelskspråkig kvinnlig talare. Om du har ställt in en talare som både är engelskspråkig och kvinnlig används den talaren, annars väljes talaren som bäst passar in automatiskt. För att lära dig mer om hur KTTS väljer talare, se “Filter (avancerat)”.
När du klickar på fliken Talare i kttsmgr, visas sidan Talare. Sidan visas också automatiskt om du startar kttsmgr och ännu inte har ställt in några talare.
![]() | Klicka för att lägga till en ny talare. |
![]() | Alla inställda talare listas här. Talaren med högst prioritet listas överst. Den översta talaren används för att utföra uppläsningen när ett program inte anger en talare. |
![]() | Klicka på en talare i listan för att markera den, och klicka på den här knappen för att ta bort den. |
![]() | Klicka på en talare i listan för att markera den, och klicka på den här knappen för att visa inställningsdialogrutan i insticksprogrammets för talsyntes. Se nedan. |
![]() | Klicka på en talare i listan för att markera den, och klicka på den här knappen för att flytta den neråt i listan. Ju lägre en talare visas i listan, ju lägre är dess prioritering. |
![]() | Klicka på någon av dessa knappar för att verkställa ändringarna du har gjort i KTTS-systemet som kör. |
När du klickar på knappen Lägg till, visas skärmen Lägg till talare.
![]() | Du kan välja ett insticksprogram för talsyntes antingen med namnet på en Talsyntes, eller enligt Språk som talsyntesen kan läsa upp. Markera alternativknappen intill motsvarande ruta. När alternativknappen Språk är markerad, visar rutan Språk alla språk som stöds av alla tillgängliga talsyntesprogram, och rutan Talsyntes visar bara de talsyntesprogram som stöder det valda språket. När alternativknappen Talsyntes är markerad, visar rutan Talsyntes alla tillgängliga talsyntesprogram, och rutan Språk visar bara de språk som stöds av det valda talsyntesprogrammet. |
![]() | Välj språk och insticksprogram för syntes här. |
![]() | När du klickar här, ställer de flesta insticksprogram för talsyntes in sig själva automatiskt, och väljer en standardinställning. En ny talare visas i listan under fliken Talare. Klicka på knappen för att visa eller redigera inställningen för talaren. |
När du klickar på knappen Lägg till under fliken Talare och lägger till en talare som inte kan ställas in automatiskt, eller klickar på knappen Redigera, visas sidan Inställning av talare. Varje insticksprogram för talsyntes har en egen sida för inställning av talare. Följande är ett exempel på inställning av insticksprogrammet för interaktiv Festival. För specifika sätt att ställa in varje insticksprogram, se “Anpassning”.
![]() | Ange sökvägen till det körbara Festival-programmet. Om Festival finns i miljövariabeln PATH, skriv bara in |
![]() | Klicka för att söka efter tillgängliga röster. |
![]() | Välj en röst. |
![]() | Välj en teckenkodning för text som skickas till Festival. För röster som KTTS känner till, väljes inställningen automatiskt åt dig. I allmänhet använder västerländska språk ISO 8859-1. Östeuropeiska språk som tjeckiska eller slovakiska använder ISO 8859-2. |
![]() | Klicka för att testa. Du ska höra en testmening läsas upp. |
![]() | Använd reglagen för att ställa in det syntetiserade talets volym, talhastighet och tonhöjd. Om något av dem är inaktiverat (grått), stöder inte den valda rösten att de ändras. |
![]() | Vissa röster, såsom MultiSyn-röster, är så stora att de kräver flera sekunder att laddas. Markeras rutan gör att de laddas när KTTSD startas, och på så sätt sparas tid (till kostnad av användning av mer minne) innan den första meningen syntetiseras. |
Klicka på knappen för att spara talarens inställningar.
Försäkra dig om att klicka på knappen , annars får dina ändringar ingen effekt i KTTS-systemet som kör.
Med antagandet att testen fungerade, är du nästan klar att börja använda KTTS. Gå nu tillbaka till fliken Allmänt och markera rutan Aktivera text-till-tal systemet (KTTSD). Det startar KDE:s text-till-tal demon. Se “Starta KTTSD och ställa in allmänna alternativ”. Du kan nu börja använda KTTS för att läsa upp text. Klicka på fliken Jobb för att skapa och hantera textjobb. Se “Hantera textjobb”.
När du väl har ställt in minst en talare, kan du starta KDE:s text-till-tal system. Klicka på fliken Allmänt. Sidan Allmänt visas. Du kan också ställa in några allmänna alternativ på den här sidan.
![]() | Markera rutan för att aktivera KTTS-systemet. Det startar KDE:s text-till-tal demon (KTTSD). Om KTTSD startas med lyckat resultat, visas fliken Jobb. När KTTSD väl har startats, kan du börja skapa och läsa upp textjobb. Se “Hantera textjobb”. Avmarkeras rutan, stoppas KTTSD och KDE:s text-till-tal system inaktiveras. NoteraOm rutan är inaktiverad, har du ännu inte ställt in några talare (eller så glömde du klicka på knappen Verkställ). Se “Anpassa insticksprogram för syntes (talare)”. |
![]() | När rutan är markerad, visas en ikon i systembrickan så fort kttsmgr kör. Klickas eller i detta läge avslutas inte kttsmgr. Istället försvinner skärmen, men kttsmgr fortsätter att köra i systembrickan. Klicka på ikonen för att återställa skärmen. För att avsluta kttsmgr, högerklicka på ikonen i systembrickan och välj Avsluta. När rutan inte är markerad, visas inte någon ikon i systembrickan. Klickas eller avslutas kttsmgr. NoteraNär kommandot kttsmgr avslutas, fortsätter KTTS köra om rutan Aktivera text-till-tal (KTTSD) är markerad. NoteraDet här alternativet får ingen effekt förrän nästa gång kttsmgr startas. NoteraDet här alternativet har ingen effekt när kttsmgr körs i KDE:s inställningscentral. |
![]() | När rutan markeras, visas skärmen för kttsmgr när du startar kttsmgr. Om den inte är markerad visas ikonen för kttsmgr i systembrickan när kttsmgr startas, men skärmen visas inte. Klicka på ikonen i systembrickan för att få skärmen att visas. |
![]() | När rutan är markerad, och kttsmgr inte redan kör, visas det i systembrickan så fort KTTSD läser upp något. Det ger dig möjlighet att stoppa eller på annat sätt hantera uppläsningen. |
![]() | När rutan är markerad, och kttsmgr automatiskt visas i systembrickan så fort uppläsning sker, försvinner det också automatiskt när uppläsningen är klar. |
![]() | Försäkra dig om att du klickar här för att spara dina inställningar. |
När du klickar på fliken Jobb i kttsmgr, visas sidan Jobb.
![]() | Alla textjobb som för närvarande finns i kön listas här, tillsammans med programmet som köade jobbet, jobbets nuvarande tillstånd, antal meningar i jobbet, och det nuvarande meddelandenumret. Talarens identifikation motsvarar kolumnen Id på sidan Talare. |
![]() | Knapparna i den här verktygsraden låter dig starta, ta bort och göra paus i uppläsningsjobb. Välj ett jobb i listan nedan, och klicka på en av knapparna. |
![]() | Knapparna i den här verktygsraden låter dig gå fram eller tillbaka en mening i jobbet som är markerat i listan nedan. (Alla jobb har inte flera delar.) |
![]() | Knapparna i den här verktygsraden låter dig läsa upp texten som för närvarande finns på KDE:s klippbord, eller öppna en textfil som ska läsas upp. Du kan också uppdatera listan med textjobb. Se “Välja talare (avancerat)”. |
![]() | Meningen som för närvarande läses upp visas här. |
![]() | När du klickar på verkställs alla ändringar av inställningar på andra sidor (om det finns några) och kttsmgr minimeras till systembrickan. Klicka på ikonen i systembrickan för att återställa skärmen. |
![]() | Dra avdelaren för att ändra storlek på jobblistan och rutan Nuvarande mening. |
Fliken Jobb visas bara när KTTSD kör. Om du inte ser fliken Jobb, klicka på fliken Allmänt och markera rutan Aktivera text-till-tal (KTTSD).
Om du inte har installerat ljudsystemet aRts, men har installerat ALSA, Gstreamer eller aKode, klicka på fliken Ljud. Se “Ljudinställningar”.
På den här sidan listas och styrs bara textjobb. Skärmläsningsutmatning, varningar och meddelanden visas inte. För mer information om meddelandetyper i KTTS, se “Filter (avancerat)”.
När du klickar på fliken Ljud i kttsmgr, visas sidan Ljud.
![]() | Välj ljudutmatningsmetod här. Om en komponent är grå, kompilerades antingen KTTS utan stöd för det ljudinsticksprogrammet, eller kunde inte KTTS ladda nödvändiga bibliotek. |
![]() | Om Gstreamer eller aKode är vald för ljudutmatning, välj metoden för ljudsänka här. Om inga sänkor anges, måste du installera minst en. Om ALSA är installerad, välj PCM-enhenten här. Se “Krav”. |
![]() | Justera uppläsningens hastighet här. 50 % är ungefär två gånger långsammare än normalt, medan 200 % är ungefär två gånger snabbare. Du måste ha installerat verktyget sox för att inställningen ska fungera. |
![]() | När rutan är markerad, kopierar KTTS tillfälliga ljudfiler (.wav-filer) till angiven katalog. Välj vilken katalog på hårddisken du vill, men du måste kunna skriva i den. Det kan vara användbart för att skapa ljudfiler med tal för andra syften. Filerna får namn på formen |
![]() | Försäkra dig om att klicka på knappen , för att använda de nya inställningarna i KTTS-systemet som kör. |
Det finns två sätt att justera talhastigheten i KTTS. Många av Talarna har inställningen Hastighet i sina inställningsdialogrutor, som du kan visa genom att klicka på på sidan Talare. Inställningen Hastighet på sidan Ljud finns förutom talarens hastighetsinställning, och kan i allmänhet användas även om talaren inte stöder en hastighetsinställning. För att denna hastighetsinställning ska fungera, måste du ha installerat verktyget sox på systemet (Debian-användare: apt-get install sox). Dessutom ignoreras hastighetsinställningen när text som innehåller SSML läses upp (se “SSML”).
Listan med ALSA-enheter omfattar alla ALSA PCM-enheter och insticksprogram som är inställda i systemet. Många av valen fungerar inte. Du måste experimentera för att hitta en enhet som fungerar för dig. Om du är tveksam, välj default.
När du klickar på fliken Avbrott i kttsmgr, visas sidan Avbrott.
Den här sidan låter dig ange speciella åtgärder som ska utföras så fort ett textjobb avbryts av ett annat, högre prioriterat, meddelande. Det finns fyra sorters taljobb som KTTS hanterar:
Vanlig text.
Meddelanden.
Varningar.
Skärmläsningsutmatning.
Skärmläsningsutmatning har högst prioritering. Den är reserverad för användning av skärmläsningsprogram. Skärmläsningsutmatning går före alla andra meddelande, och gör paus i dessa jobb. Så fort skärmläsningsutmatningen har lästs upp, återupptas automatiskt jobben som avbröts.
Varningar har följande prioritering. De är reserverade för meddelanden med hög prioritet, som "Processorn överhettas". En varning avbryter meddelanden och vanlig text, och gör paus i dessa jobb. Så fort varningen har lästs upp, återupptas automatiskt jobben som avbröts.
Meddelanden har följande prioritering. Ett meddelande avbryter vanliga textjobb. KMouth är ett exempel på ett program som använder meddelanden. Till exempel medan en lång text från en webbsida läses upp, kan KMouth användas för att hälsa på någon som kommer in i rummet.
Alla fyra sorters jobb har köer, utom skärmläsningsutmatning. Om en skärmläsningsutmatning skickas från ett program medan KTTS läser upp en annan skärmläsningsutmatning, stoppas meddelandet som håller på att läsas upp och kastas.
När ett textjobb avbryts av ett meddelande, en varning eller en skärmläsningsutmatning, lägger KTTS till ljudutmatningen på den här sidan till strömmen.
![]() | Det här meddelandet läses upp så fort ett vanligt textjobb avbryts. |
![]() | Den här ljudfilen spelas upp så fort ett vanligt textjobb avbryts. Om både Inledande ljud och Innan meddelandet är angivna, spelas Inledande ljud upp innan Innan meddelandet läses upp. |
![]() | Det här meddelandet läses upp så fort ett avbrutet textjobb återupptas. |
![]() | Den här ljudfilen spelas upp så fort ett avbrutet textjobb återupptas. Den spelas upp sist. |
Inställningarna på den här sidan gäller bara vanliga textjobb. Meddelanden, varningar eller skärmläsningsutmatningar har inga särskilda åtgärder när de avbryts av ett meddelande med högre prioritering.
När du kör KDE:s webbläsare Konqueror, kan du läsa upp texten på webbsidan som visas. Försäkra dig först om att KTTS kör. Markera texten du vill läsa upp, och välj -> i huvudmenyn. Efter ett ögonblick, ska den markerade texten börja läsas upp.
Det är nästan alltid en god idé att markera texten på webbsidan som du vill ska läsas upp. Du kan hoppa över steget, men du hör då en mängd HTML-huvuden och andra osynliga taggar läsas upp.
När du kör KDE:s avancerade texteditor (Kate), kan du läsa upp texten som visas. Försäkra dig först om att KTTS kör. Markera texten du vill läsa upp, och välj -> i huvudmenyn. Efter ett ögonblick, ska den markerade texten börja läsas upp.
Du behöver inte först markera text. I detta fall, läses hela filen upp.
Detta fungerar också när Kate kör inbäddad i ett annat program, som Konqueror eller Quanta.
Knotify är meddelandesystemet i KDE, som gör dig uppmärksam på händelser som du ställer in i KDE-systemet. Du kan anpassa KTTS att läsa upp textmeddelanden.
Till exempel tillåter Konversation, ett KDE IRC-program, dig att ställa in en stor uppsättning meddelanden. Du kan till exempel tala om för Konversation att underrätta dig så fort ett meddelande där ditt smeknamn ingår dyker upp i en IRC-kanal. Tillsammans med KTTS, kan du låta KDE läsa upp IRC-meddelandets text.
I allmänhet, om ett KDE-program stöder Knotify, visas menyalternativet Anpassa meddelanden i menyn Inställningar. De specifika sätten att anpassa varje program för Knotify varierar från program till program.
För att göra det möjligt för KTTS att läsa upp textmeddelanden från Knotify, starta kttsmgr och klicka på fliken Underrättelser. Sidan Underrättelser visas.
![]() | Markera rutan för att aktivera uppläsning av KDE:s underrättelser. Om den inte är markerad, är allt på sidan inaktiverat och KTTS läser inte upp några underrättelser. |
![]() | Om markerad, läser inte KTTS upp händelser med ett ljud från något program. |
![]() | Använd knapparna för att lägga till eller ta bort programhändelser från listan nedan. När du klickar på knappen , visas en ruta där du väljer program och händelse som du vill lägga till i listan. |
![]() | Händelsen läser upp meddelandet Konversation skickar när någon nämner ditt smeknamn i ett Internet Relay Chat-meddelande. |
![]() | För alla andra händelser som kommer från Konversation, sker ingen åtgärd i KTTS. |
![]() | För alla andra händelser som inte anges på annat sätt i listan, sker ingen åtgärd i KTTS. |
![]() | Använd rutan för att ange vad KTTS ska göra när en händelse tas emot. Alternativen är:
|
![]() | Om åtgärden är Läs upp egen text, skriv in meddelandetexten som du vill ska läsas upp här. Du kan använda följande ersättningssträngar i meddelandet:
|
![]() | Testa meddelandet genom att klicka här. |
![]() | Du kan ange egenskaper för talaren som önskas för att läsa upp underrättelsemeddelandet här. |
Observera att det finns tre händelsenivåer. Om en åtgärd för en viss händelse från ett visst program anges, utförs den åtgärden. Annars, om en åtgärd för alla andra händelser från ett visst program anges, utförs den åtgärden. Annars utförs åtgärden som anges för alla andra händelser under Standard (alla andra händelser).
Händelsen alla underrättelser för programmet Standard (alla andra händelser) kan inte tas bort från listan. För standardvärdet alla andra händelser kan du ange typ av underrättelse som läses upp, enligt följande:
Ingen läses upp.
Underrättelser som visar en dialogruta på skärmen, som du sedan måste stänga, läses upp.
Underrättelser som visar ett passivt meddelande på skärmen, som automatiskt försvinner efter ett ögonblick, läses upp.
Underrättelser som visas på skärmen, passiva eller inte, läses upp.
Alla underrättelser, oberoende av om de visar något på skärmen, läses upp.
Strängersättningsfilter är ett bra sätt att göra iordning meddelanden som skickas från program om de har felaktigt uttal eller läses upp felaktigt i KTTS. Filen kmail.xml
som levereras med KTTS, är ett bra exempel. Den tar bort taggarna br och b i underrättelsemeddelanden från KMail, och tar också bort meningen /local/inbox/, eftersom det kan förutsättas i de flesta fall. Se “Anpassa strängersättningsfilter”.
Använd knappen för att spara inställningar av underrättelser i en fil. Använd knappen för att ladda sparade inställningar från en fil. De laddade händelserna blandas med befintliga händelser i listan. Om du vill börja med en tom lista, klicka först på knappen . Alla händelser utom alla underrättelser raderas.
Försäkra dig om att klicka på knappen eller , för att spara dina inställningar.
SSML (Speech Synthesis Markup Language) är en W3C-standard för att märka text för uppläsning. Det tillhandahåller taggar för att styra röster, talhastighet, volym, kön och tonhöjd. Det tillhandahåller också taggar för att styra hur ord läses upp, till exempel utskrift av förkortningar. SSML är en del av specifikationen VoiceXML, som också är en W3C-standard.
För närvarande tillhandahåller KTTS begränsat och mycket grundläggande stöd för SSML. Det har för närvarande följande begränsningar:
Fungerar bara med talarna i Festival (interaktivt) och Hadifix.
Du måste installera rösten rab_diphone (brittisk man), eftersom det är den förvalda rösten som Festival använder vid uppläsning av SSML.
Inställningen Hastighet på sidan Ljud ignoreras när text som innehåller SSML läses upp.
Om inställningarna Hastighet eller Tonhöjd i Festivals inställningsdialogruta inte är inställda till 100 %, gör det oftast att SSML-texten läses upp monotont.
Följande exempeltext kan användas för att experimentera med SSML.
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE speak PUBLIC "-//W3C//DTD SYNTHESIS 1.0//EN" "http://www.w3.org/TR/speech-synthesis/synthesis.dtd"> <speak version="1.0" xml:lang="en-US"> <prosody pitch="low"> Who's been sleeping in my bed? </prosody> said papa bear. <prosody pitch="medium"> Who's been sleeping in my bed? </prosody> said momma bear. <prosody pitch="high"> Who's been sleeping in my bed? </prosody> said baby bear. </speak>
Robustare stöd för SSML planeras för nästa version av KTTS.
Filter är en avancerad funktion i KTTS. De behövs inte för den grundläggande användningen av KTTS.
Filter används för att förbehandla text innan den skickas till talsyntesprogrammet. De är användbara för att förbättra tal, ersätta felupplästa ord eller förkortningar, välja lämpligt språk och talare, eller gå runt vissa begränsningar i talsyntesen och dess röster.
För att förstå hur filter används, är det till hjälp att först förstå hur text behandlas av KTTS. Text som läses upp av KTTS är av fyra möjliga typer.
Skärmläsningsutmatning.
Varningar.
Meddelanden
Textjobb
Typen avgörs av programmet som skickar texten till KTTS.
Skärmläsningsutmatning har högst prioritering. Den är reserverad för användning av skärmläsningsprogram. Skärmläsningsutmatning går före alla andra meddelande, och gör paus i dessa jobb. Så fort skärmläsningsutmatningen har lästs upp, återupptas automatiskt meddelanden som avbröts.
Varningar har näst högst prioritering. De är reserverade för meddelanden med hög prioritet, som "Processorn överhettas". En varning avbryter meddelanden och vanlig text, och gör paus i dessa jobb. Så fort varningen har lästs upp, återupptas automatiskt meddelanden som avbröts.
Meddelanden har följande prioritering. Ett meddelande avbryter vanliga textjobb. KMouth är ett exempel på ett program som använder meddelanden. Till exempel medan en lång text från en webbsida läses upp, kan KMouth användas för att hälsa på någon som kommer in i rummet. KDE:s underrättelser är också meddelanden (se “Talade meddelanden (Knotify)”).
Resten är vanliga textjobb. Alla jobb som du startar från fliken Jobb är textjobb. Ksayit är ett exempel på ett program som använder textjobb. Textjobb är avsedda för längre talutmatning som inte är brådskande.
Alla fyra sorters jobb har köer, utom skärmläsningsutmatning. Om en skärmläsningsutmatning skickas från ett program medan KTTS läser upp en annan skärmläsningsutmatning, stoppas meddelandet som håller på att läsas upp och kastas.
Det första du måste veta om filter är att de aldrig används för skärmläsningsutmatning. De används för varning, meddelanden och textjobb, och dessutom för KDE:s underrättelser (Knotify).
Det finns två sorters filter, vanliga filter och filter för detektering av meningsgränser (SBD-filter). SBD-filter delar upp text i enskilda meningar. Det gör att KTTS kan börja uppläsning snabbare, eftersom bara den första meningen behöver syntetiseras, inte hela textjobbet. Det låter dig också att gå framåt eller bakåt mening för mening under fliken Jobb, eller stoppa och göra paus i textjobb när talsyntesen inte direkt stöder att stoppa uppläsningen.
Vanliga filter behandlar texten och skickar den vidare till nästa filter. Det finns för tillfället tre sorters vanliga filter.
Strängersättning
XML-omvandling
Val av talare
Filter är implementerade med en insticksarkitektur. Det kan komma att finnas ytterligare sorters filter i framtiden.
Strängersättningsfilter ersätter textdelar med annan text. De ersatta delarna matchas antingen som ord eller som reguljära uttryck. KTTS levereras med fördefinierade strängersättningsfilter för att läsa upp förkortningar och chattsmilisar som ":-)", eller för att formatera om underrättelsemeddelanden från Konversation eller KMail till en form som är enklare att förstå.
XML-omvandlingsfilter använder en XML-stilspråkomvandlingsfil (XSLT-fil) för att konvertera XML med ett format till ett annat format. KTTS levereras med några XSLT-filer för att konvertera XHTML till SSML.
Val av talare låter dig att skicka jobb till en talare baserat på textens innehåll, eller baserat på programmet som skickade det till KTTS. Om du till exempel har ställt in en kvinnlig talare under fliken Talare, kan du skicka text som kommer från Ksayit till den talaren. Se “Anpassa insticksprogram för syntes (talare)”.
Var och en av dessa filtertyper har inställningsbara regler som avgör när filtret ska påverka texten att läsa upp. Om filtret avgör att det inte ska påverka texten, skickas texten vidare till nästa filter oförändrad.
När ett textjobb, meddelande, varning eller KDE underrättelsemeddelande skickas till KTTS, går det igenom alla aktiverade filter som du har ställt in på skärmen nedan. Ordningen är uppifrån och ner. Efter att ha gått igenom alla vanliga filter listade i den övre delen av skärmen, skickas textjobb till filtren Detektering av meningsgräns (SBD-filtren). KDE:s underrättelsemeddelanden, varningar och meddelanden går aldrig igenom SBD-filter. I motsats till vanliga filter, så stoppar det första SBD-filter som gör ändringar i texten ytterligare filtrering.
Klicka på fliken Filter i kttsmgr för att använda filter.
![]() | Det här är listan med inställda vanliga filter. Om omarkerat, är filtret inaktivt och hoppas över. Filter används i ordningen som anges här, uppifrån och ner. |
![]() | Klicka här för att lägga till ett nytt filter. Du blir tillfrågad om vilken sorts filter som ska läggas till. Efter du har valt sort, se inställningsdialogrutorna nedan. |
![]() | Klicka här för att ta bort ett filter. |
![]() | Klicka här för att ändra ett filters inställning. Se inställningsdialogrutorna nedan. |
![]() | Klicka på knapparna för att flytta upp eller ner ett filter i listan. |
![]() | Det här är filtren för detektering av meningsgränser. När du startar KTTS för första gången, ställs automatiskt standardfiltret för detektering av meningsgränser in åt dig. Du kan ändra filtrets inställning, eller lägga till ytterligare filter för detektering av meningsgränser, men vi råder nybörjare att inte ändra dem. |
![]() | Den här kombinationsrutan låter dig lägga till, ta bort, redigera eller ändra ordning på filter för detektering av meningsgränser. |
![]() | Försäkra dig om att du klickar här, annars får dina inställningar ingen effekt. |
Du ställer in stängersättningsfilter genom att tillhandahålla en lista med ord eller reguljära uttryck som ska matchas. När det matchade ordet eller reguljära uttrycket hittas i texten, ersätts vart och ett av en ersättningssträng som du anger. Matchningen är okänslig för skiftläget.
![]() | Skriv in ett namn på ditt filter. Använd vilken namn du vill som skiljer det från alla andra filter. |
![]() | Det här är listan med ord och reguljära uttryck. Filtret söker efter matchande strängar för varje sträng i kolumnen Matcha, och ersätter den matchande strängen med strängen i kolumnen Ersätt med. Listan behandlas i ordningen den visas, uppifrån och ner. |
![]() | Klicka här för att lägga till ytterligare ett ord eller reguljärt uttryck i listan. |
![]() | Klicka här för att flytta ordet eller det reguljära uttrycket som för närvarande är markerat upp eller ner i listan. |
![]() | Klicka för att ändra ett befintligt ord eller reguljärt uttryck i listan. |
![]() | Klicka för att ta bort det befintliga ordet eller reguljära uttrycket som för närvarande är markerat från listan. |
![]() | Använd knapparna för att ladda en lista med ord eller reguljära uttryck från en fil, spara nuvarande lista till en fil, eller rensa hela listan. När du laddar från en fil, läggs posterna i filen till sist i den befintliga listan. |
![]() | Om inte tom, används filtret bara om språket för textjobbets talare stämmer med språket du skriver in här. Klicka på knappen för att visa en lista över språk. Du kan välja mer än ett språk genom att trycka på Ctrl när du klickar. |
![]() | Om inte tom, används filtret bara om texten kommer från ett av programmen som listas. Du kan skriva in mer än ett program åtskilda med kommatecken. Exempel: TipsDu kan ta reda på Programidentifikation för program som kör med programmet kdcop. Du ska utelämna DCOP-numret. Om kdcop till exempel visar programidentifikationen kopete-3234, ska du bara skriva in |
Strängersättningsfiltret används bara för text om alla villkor som inte är tomma uppfylls i rutan Använd filtret när. Om alla rutor är tomma, gäller filtret all text.
All matchning är okänslig för skiftläge.
När ord matchas, använder strängersättningsfiltret ett reguljärt uttryck på formen \sord
\s internt. Med andra ord, måste ordet ha ordgränser (blanktecken) på båda sidor.
En beskrivning av hur man skriver reguljära uttryck är utanför den här handbokens omfattning. Om du har KDE:s editor av reguljära uttryck installerad, finns en knapp tillgänglig på skärmarna Lägg till och Redigera som hjälper dig att skapa reguljära uttryck. KDE:s editor av reguljära uttryck ingår i paketet kdeutils.
KTTS levereras med några filer med ordlistor, inklusive en lista med smilisar, som ":-)", några förkortningar som typiskt används i IRC- och direktmeddelandeprogram, och en lista med andra förkortningar. Det finns också en lista med specialtecken, som den nuvarande versionen av den polska rösten i Festival inte kan hantera. Om du utvecklar användbara egna ordlistor, använd knappen Spara för att spara dem i en fil, och skicka dem till KTTS-gruppen så att de kan inkluderas i nästa version.
Filtret för XML-omvandling använder XSLT-filer för att omvandla XML från ett format till ett annat. XSLT, XML-stilspråkomvandlingar, är ett W3C standardspråk för att utföra sådana omvandlingar. Det kan bara användas med välformad XML. Du måste ha verktyget xsltproc installerat.
![]() | Skriv in ett namn på ditt filter. Använd vilken namn du vill som skiljer det från alla andra filter. |
![]() | Skriv in fullständig sökväg till en befintlig XSLT-fil, som utför omvandlingen. |
![]() | Ange sökvägen till verktyget xsltproc. Om xsltproc finns i miljövariabeln PATH, skriv helt enkelt in |
![]() | Om inte tom, används filtret bara om XML har angivet rotelement eller specifikationen <![CDATA[<!DOCTYPE]]> som börjar med den angivna strängen. Det skiljer en form av XML från en annan. Till exempel |
![]() | Om inte tom, används filtret bara om texten kommer från ett av programmen som listas. Du kan skriva in mer än ett program åtskilda med kommatecken. Exempel: TipsDu kan ta reda på Programidentifikation för program som kör med programmet kdcop. Du ska utelämna DCOP-numret. Om kdcop till exempel visar programidentifikationen kopete-3234, ska du bara skriva in |
Filtret för XML-omvandling används bara för text om om angivet rotelement eller DOCTYPE stämmer och om program-id stämmer i rutan Använd filtret när. Om en ruta är tom, utförs inte testen, så om alla rutor är tomma gäller filtret för all text. Du bör dock fylla i minst en ruta, eftersom många textjobb inte har XML-format.
Filter för val av talare används för att styra texten till en önskad talare inställd under fliken Talare, eller till någon talare som har angivna egenskaper. Du kan till exempel ange att text som kommer från kmail ska läsas upp av en talare som är inställd till en kvinnlig röst. Se “Anpassa insticksprogram för syntes (talare)”.
Precis innan KTTS börjar skicka text till vart och ett av filtren, väljer det en talare som ska läsa upp texten. Valet av talare är baserat på talarens egenskaper som anges av programmet som skickar texten till KTTS, och egenskaper hos talare som du har ställt in under fliken Talare. Filtret för val av talare tillåter att du överskrider den valda talaren.
![]() | Skriv in ett namn på ditt filter. Använd vilken namn du vill som skiljer det från alla andra filter. |
![]() | Om inte tom, används filtret bara om texten innehåller det inskrivna reguljära uttrycket. Om den är installerad, klicka på bläddringsknappen för att starta KDE:s editor av reguljära uttryck som hjälper dig att skriva in det reguljära uttrycket. TipsFör bättre prestanda, försök att "förankra" det reguljära uttrycket till strängens början. Med andra ord, inled ditt reguljära uttryck med |
![]() | Om inte tom, används filtret bara om texten kommer från ett av programmen som listas. Du kan skriva in mer än ett program åtskilda med kommatecken. Exempel: TipsDu kan ta reda på Programidentifikation för program som kör med programmet kdcop. Du ska utelämna DCOP-numret. Om kdcop till exempel visar programidentifikationen kopete-3234, ska du bara skriva in |
![]() | Ange egenskaper hos talaren som du föredrar ska läsa upp texten här. Om texten uppfyller filtervillkoren ovan, väljes en talare som passar bäst in på egenskaperna du anger här. Klicka på knappen till höger för att visa sidan Välj talare. Se “Välja talare (avancerat)”. |
![]() | Använd knapparna för att spara inställningarna i Val av talare, för att ladda inställningar från en sparad fil, eller rensa alla inställningar. |
Filtret för val av talare används bara för text om alla villkor som inte är tomma uppfylls i rutan Använd filtret när. Du måste fylla i minst en av rutorna.
Det enklaste sättet att lära sig hur val av talare ställs in är att experimentera. Inaktivera val av talare och låt någon text läsas upp. Observera talaren som KTTS väljer under fliken Jobb. Klicka på knappen , skriv in några egenskaper, och försök igen för att se hur valet påverkas. Du måste förstås ha mer än en talar inställd för att val av talare ska göra någonting.
Filter för att detektera meningsgränser (SBD-filter) delar upp texten i enskilda meningar. Det är viktigt eftersom det
tillåter att KTTS börjar läsa upp texten snabbare, eftersom det bara behöver syntetisera den första meningen, istället för hela textblocket, vilket kan vara mycket långt, och
låter dig gå bakåt eller framåt mening för mening under fliken Jobb, och
låter dig göra paus eller stoppa textjobb under fliken Jobb, även om talsyntesen inte har möjlighet att stoppas.
Av dessa orsaker, ställs standardfiltret för detektering av meningsgränser automatiskt in första gången du kör kttsmgr och kan inte inaktiveras (även om du kan ta bort det). Vi råder dig att inte ändra filtret, om du inte vet vad du gör.
Du kan dock lägga till ytterligare SBD-filter för att lösa vissa problem. Till exempel har den polska rösten i Festival, vid tidpunkten februari 2005, den irriterande egenskapen att den läser upp interpunktion. Den läser till exempel upp punkterna i slutet på varje mening. Du kan inte lösa problemet genom att skapa ett strängersättningsfilter för att ta bort meningarnas interpunktion, eftersom om du gör det förhindras det vanliga SBD-filtret från att känna igen några meningar. Istället kan du skapa en ändrad version av det vanliga SBD-filtret som känner igen meningar, och samtidigt tar bort meningarnas interpunktion. För att göra det, lägg till ett SBD-filter och använd knappen Ladda för att ladda filen polish_festival_sbdrc
som levereras med KTTS.
SBD-filter fungerar genom att matcha ett reguljärt uttryck för meningsslut och infoga ett tabulatortecken (decimalt 8) vid meningsgränserna. (Alla tabulatortecken tas automatiskt bort från texten innan filtrering börjar.) Observera att standardfiltret bevarar meningens interpunktion.
SBD-filter används aldrig för KDE:s underrättelsemeddelanden (knotify), varningar, meddelanden eller skärmläsningsutmatning.
Om du tar bort standardfiltret för att detektera meningsgränser av misstag, kan du få tillbaka det genom att ladda filen standard_sbdrc
, som levereras med KTTS.
Du kan ställa in hur många talare som helst under fliken Talare. Se “Anpassa insticksprogram för syntes (talare)”. När program skickar text till KTTS kan de ange egenskaper för en önskad talare som ska läsa upp texten. KTTS väljer talaren som passar bäst in bland talarna som du har ställt in för att uppfylla programmets begäran. Ett program kan till exempel ange att texten ska läsas upp av en engelskspråkig kvinnlig röst. Om du har ställt in en talare som är engelskspråkig och kvinnlig används den talaren. Om du bara har ställt in engelskspråkiga manliga talare, används en av dem. Om ett program inte anger några egenskaper, används standardtalaren (den översta) som listas under fliken Talare.
När program anger egenskaper för den önskade talaren, kan de ange att vissa egenskaper "föredras" framför andra egenskaper. Ett program kan till exempel ange att det önskar att en stark kvinnlig röst läser upp texten, och att egenskapen stark "föredras" framför egenskapen kvinnlig. Om du har en tyst kvinnlig röst och en stark manlig röst inställda, väljer KTTS den starka manliga rösten för att göra uppläsningen. Eftersom språk är en kritisk parameter för att göra uppläsningen förståelig, är det alltid en "föredragen" egenskap.
Genom att använda sidan Välj talare, kan du överskrida talarinställnigar från program. Sidan visas
när du klickar på knappen under fliken Jobb, eller
när du klickar på knappen Talare i dialogrutan Filterinställning för ett filter för val av talare, eller
när du klickar på knappen Talare under fliken Underrättelser.
Sidan erbjuder tre sätt att ange egenskaper för önskade talare:
Använd standardtalaren (överst på sidan Talare). Med andra ord, anges inga egenskaper för talare.
Använd talaren som passar bäst in med en eller flera angivna egenskaper.
Använd talaren som passar bäst och har alla egenskaper hos en inställd talare. Om du inte tar bort eller ändrar talarens inställning, väljer KTTS den specifika talaren. Om du tar bort eller ändrar talarens inställningar, väljer KTTS talaren som passar bäst och har talarens ursprungliga egenskaper.
![]() | Välj sätt att skriva in önskade talaregenskaper genom att klicka på en av alternativknapparna. |
![]() | Välj egenskaper för önskade talare här. Lämna en egenskap tom om du inte bryr dig om den egenskapen. |
![]() | Markera rutan om du vill att egenskapen ska "föredras" framför andra egenskaper. Du kan markera mer än en ruta. |
![]() | Eftersom språk är en kritisk faktor för att göra tal förståeligt, är det alltid en föredragen egenskap. Det är sällsynt att använda egenskapen. Det enda tillfället du kan behöva ange språkegenskapen är när du vet att ett visst program skickar text på ett språk som skiljer sig från skrivbordets språk. |
![]() | Det här är en lista över talare som du för närvarande har ställt in i KTTS. Genom att välja en av dem, anger du på så sätt alla egenskaper för talaren. Om talaren fortfarande är inställd när text skickas, får du en exakt träff och talaren väljes. Om du dock senare tar bort talaren, eller ändrar inställningarna, kanske det inte blir den valda talaren längre. Talaren som passar bäst in på de ursprungliga egenskaperna väljes. |
Egenskapen Språk är speciell eftersom text troligen blir omöjlig att förstå om den läses upp av en talare som använder ett språk som skiljer sig från textens. Därför är språket automatiskt en egenskap som "föredras". Om du anger ett språk, överskrider det valt språk, men om du lämnar det tomt, används den befintliga språkinställningen. Om programmet som skickar texten till KTTS inte angav ett språk, tilldelar KTTS den översta talarens språk som du har ställt in under fliken Talare. Med andra ord, den översta talaren antas tala skrivbordets språk.
För att rensa alla egenskaper i sektionen Använd närmaste matchande talare som har, klicka först på alternativknappen Använd förvald talare, och klicka därefter på alternativknappen Använd närmaste matchande talare som har.
KTTS har två programmeringsgränssnitt (API:er):
KDE:s text-till-tal programmeringsgränssnitt som används av programmerare för att ge programmen text-till-tal funktioner. Program kommunicerar med KTTSD via DCOP.
KTTSD gränssnitt för insticksprogram som används för att lägga till insticksprogram för talsyntes till KTTSD, så att KTTS fungerar med ett nytt talsyntesprogram.
Följande avsnitt ger en kort beskrivning av KDE:s text-till-tal programmering med DCOP-gränssnitt. Fullständig dokumentation för båda programmeringsgränssnitten är tillgänglig direkt på KDE:s webbplats för handikappstöd (http://accessibility.kde.org).
Program skickar begäran om text-till-tal tjänster via KDE:s DCOP-gränssnitt till objektet KSpeech i programmet kttsd.
Skriv in följande kommandon i en terminal.
Om KTTSD inte redan kör
kttsd
För att köa ett textjobb som ska läsas upp
dcop kttsd KSpeech setText "
text
" "talare
"
där
är texten som ska läsas upp, och text
är en språkkod som talare
, en
, etc. Kommandot läser inte upp texten, utan istället köar det ett textjobb för uppläsning.sv
Exempel.
dcop kttsd KSpeech setText "Det här är en test." "sv"
För att läsa upp det senast köade textjobbet
dcop kttsd KSpeech startText
0
I det här fallet, hänvisar 0
till det senast köade jobbet. Du kan också ange ett specifikt jobbnummer. (Om inget jobbnummer anges, krävs 0
.)
För att stoppa textjobbet som för närvarande läses upp
dcop kttsd KSpeech stopText 0
Beroende på vilket insticksprogram för talsyntes som används, kanske inte uppläsningen stoppar omedelbart.
Det finns många fler kommandon som kan skickas. För att se en lista av möjliga kommandon, skriv
dcop kttsd KSpeech
eller läs KDE:s text-till-tal programmeringsgränssnitt direkt.
5.1. | kttsmgr kraschar omedelbart när jag startar det. Jag kompilerade med avlusningsstöd, och jag får inte ens en bakåtspårning. |
Gstreamer har kraschat och dragit med KTTS. Du måste troligen "registrera" Gstreamer. För Gstreamer 0.8x är kommandot gst-register-0.8. Om det inte löser problemet, kanske du har en version av Gstreamer som inte fungerar med KTTS installerad. Du skulle kunna försöka uppdatera eller att avinstallera Gstreamer. | |
5.2. | ALSA-ljudutmatning fungerar inte om jag spelar musik i ett annat program samtidigt. När jag gör paus i ett textjob, fryses KTTS. Jag ser "unable to open PCM" i terminalutmatningen. |
Du har problemet med konflikt över enheter i ALSA, som förhindrar att mer än en PCM-enhet öppnas åt gången. Se ALSA:s webbplats (dmix) för möjliga lösningar. www.alsa-project.org | |
5.3. | Jag måste börja om. Hur gör jag för att helt avsluta KTTS? |
Skriv in följande kommandon i en terminal: killall kttsd killall kttsmgr | |
5.4. | Hur kan jag se avlusningsutmatning från kttsd? |
Öppna två terminalfönster. Starta först kttsd i ett fönster, och starta därefter kttsmgr i det andra. | |
5.5. | Jag har en ytterligare röst för Festival som jag laddade ner från Internet. Jag installerade den och kan använda den i Festival, men den visas inte i kttsmgr. |
Redigera filen | |
5.6. | Ingen av talsyntesprogrammen som stöds, hanterar språket jag behöver. Var kan jag få tag på ett talsyntesprogram för mitt språk? |
Google™ är till stor hjälp. Den här länken kan också vara användbar. Om du hittar ett fritt talsyntesprogram som stöder ditt önskade språk, och vill lägga till stöd för den i KTTS, kontakta utvecklingsgruppen. Program med öppen källkod är särskilt välkomna. Om du känner till ett kommersiellt syntesprogram, kan du kanske övertala tillverkaren att donera en gratis kopia till utvecklingsgruppen för KTTS. Under tiden kan du få syntesprogrammet att fungera med insticksprogrammet Kommando. Se “Använda insticksprogrammet för kommando”. | |
5.7. | KTTS talar för långsamt. Hur kan jag snabba upp talet? |
Under fliken Ljud finns inställningen Hastighet. För att den ska fungera, måste verktyget sox vara installerat och i din sökväg. Vissa syntesinsticksprogram, som Festival interaktiv tillhandahåller också inställningen Hastighet i inställningsdialogrutan för talare. Beroende på rösten som används, kan den vara aktiverad eller inte. | |
5.8. | Ok, det fungerar för vissa saker, men webbsidor läses fortfarande upp för långsamt. |
Hastighetsinställningarna ignoreras när KTTS läser upp HTML. (Det beror på att HTML konverteras till SSML, som har sina egna hastighetstaggar.) Inaktivera antingen filtret för HTML XML-omvandling (se “Filter (avancerat)”), eller om du är dristig, redigera .xsl-filen i filtret för omvandling av HTML till SSML, och öka förvald talarhastighet. | |
5.9. | Jag kan inte få webbsidor att läsas upp med en kvinnlig röst. Jag har en kvinnlig talare inställd i Festival, men KTTS läser alltid upp webbsidor med en manlig röst. |
Från och med Festival 1.95 beta, verkar inte taggen SABLE GENDER fungera. För att förhindra att Festival ger fel, tar .xsl-filen för SSML till SABLE bort könstaggar. Detsamma gäller också för rösttaggar. | |
5.10. | Jag har ställt in filtret för omvandling av HTML till XML, men webbsidor läses inte alls upp med Festival-insticksprogrammet. |
På grund av ett fel i Festival 1.95 beta, måste du installera rösten rab_diphone (brittisk man) för att SABLE överhuvudtaget ska fungera, även om du inte använder rösten för att läsa upp webbsidorna. Försäkra dig också om att verktyget xsltproc är installerat och i din sökväg. | |
5.11. | Vissa tecken eller interpunktion verkar ge fel i talsyntesen, som gör att den hoppar över hela meningar, eller uttalar nonsens. Vad kan jag göra? |
Försäkra dig först om att alternativet Teckenkodning i talarens inställningsdialogruta är riktigt inställd för språket. Om vissa ord eller tecken orsakar problem, kan ett strängersättningsfilter hjälpa. Om vissa interpunktionstecken för meningar förvillar talsyntesen, måste du ställa in ett filter för detektering av meningsgränser. Se “Filter (avancerat)”. | |
5.12. | Jag har lagt till ett eget strängersättningsfilter och nu låter inte KTTS mig gå tillbaka eller framåt mening för mening. Under fliken Jobb, påstås att varje jobb bara har en enda mening. Vad har jag gjort för fel? |
Du får inte filtrera bort tecken för interpunktion av meningar (punkt, frågetecken, utropstecken, kolon och semikolon). Använd istället ett filter för detektering av meningsgränser för dessa tecken. |
KTTS
Program Copyright (c) 2002 José Pablo Ezequiel "Pupeno" Fernández (pupeno AT kde.org)
Nuvarande utvecklare: Gary Cramblitt (garycramblitt AT comcast.net)
Bidragsgivare:
Olaf Schmidt (ojschmidt AT kde.org)
Gunnar Schmi Dt (gunnar AT schmi-dt.de)
Paul Giannaros (ceruleanblaze AT gmail.com)
Dokumentation Copyright (c) 2004 Gary R. Cramblitt (garycramblitt AT comcast.net)
Översättning Stefan Asserhäll (stefan.asserhall AT comhem.se)
Den här dokumentationen licensieras under villkoren i GNU Free Documentation License.
Det här programmet licensieras under villkoren i GNU General Public License.
Talsyntesprogram som används av KTTS har sina egna licenser. Se dokumentationen för varje program eller webbplats för detaljinformation. Vissa röster har också sin egen licens.
Innehållsförteckning
KTTS är en del av KDE-projektet http://www.kde.org/.
KTTS finns i kdeaccessibility-paketet på ftp://ftp.kde.org/pub/kde/, KDE-projektets huvudsakliga FTP-plats.
FRAMTIDA: Debian installationskommando: apt-get install kdeaccessibility
Du hittar länkar till källkod och binärpaket på KDE:s webbplats för handikappstöd (http://accessibility.kde.org).
Om du har tillgång till KDE:s kodarkiv, kan du ladda ner KTTS genom att checka ut modulen kdeaccessibility. KTTS finns i katalogen kttsd. Du kan också ladda ner ett komprimerat arkiv med källkoden för kdeaccessibility från ftp://ftp.kde.org/pub/kde/
Nödvändiga krav:
KDE version 3.2 eller senare.
Ett talsyntesprogram. Följande program och talade språk stöds för närvarande:
Festival | Amerikansk engelska, brittisk engelska, spanska, tyska, finska, tjeckiska, polska, ryska, italienska, kanadensisk franska, kiswahili, zulu, and ibibio |
Festival Lite (flite) | Engelska |
Hadifix (MBROLA och txt2pho) | Tyska, ungerska |
Epos | Tjeckiska, slovakiska |
FreeTTS | Engelska |
Det fungerar också med vilket talsyntesprogram som helst som kan köras från ett kommando i en terminal.
Språken som listas ovan kanske inte är fullständiga eller aktuella. Kontrollera varje programs specifikation för en fullständig lista med språk som stöds. Kontrollera dessutom KTTS hemsida för ytterligare information som kanske inte har kommit in i handboken.
KTTS använder en flexibel insticksprogramarkitektur för talsyntesprogram. Om du vill utöka KTTS för att stöda ytterligare ett program, kontakta utvecklingsgruppen.
Se “Anpassning” för specifika instruktioner för vart och ett av dessa program.
Åtminstone ett av följande ljudsystem:
KDE:s ljudsystem aRts. aRts är oftast installerat med KDE.
ALSA (Avancerad Linux® ljudarkitektur). ALSA är installerat på de flesta Linux®-system. (www.alsa-project.org)
Gstreamer version 0.8.7 eller senare. Observera: försäkra dig om att registrera dina Gstreamer insticksprogram genom att köra kommandot gst-register innan Gstreamer används i KTTS. (http://gstreamer.freedesktop.org)
aKode-biblioteket. aKode är ett avkodarbibliotek som är en del av KDE.
KDE-projektet planerar att sluta använda aRts från version 4.
Vissa användare upplever konflikt över enheter med ALSA. Om systemet har problemet, kan du inte samtidigt spela musik och läsa upp text. KTTS fryses också om du gör paus i ett textjobb och därefter startar ett annat. Se ALSA:s webbplats (dmix) för möjliga lösningar.
Vid juli 2005 stöder inte aKode en verklig pausmöjlighet. När du gör paus i ett textjobb i KTTS fortsätter det läsa nuvarande mening.
Valfria komponenter:
Ljudverktyget sox behövs för att justera allmän uppläsningshastighet, men krävs inte. Debian-användare kan installera sox med kommandot apt-get install sox. Sox ingår i de flesta distributions-cd med Linux®.
Verktyget xsltproc behövs för SSML-stöd och för XML-omvandling, men krävs inte. Debian-användare kan installera xsltproc med kommandot apt-get install xsltproc.
För att kompilera KTTS måste du ha en aktuell kopia av KDE:s utvecklingsfiler (KDE 3.4 eller senare), inklusive kdelibs och arts.
Om du har laddat ner KTTS som ett komprimerat arkiv, logga in som en vanlig användare och packa upp arkivet i en lämplig katalog, gå till katalogen, och skriv in följande kommandon:
./configure make
Följande väljare till configure är tillgängliga:
Förvald väljare | Beskrivning | Reserv |
--with-arts | Bygger ljudinsticksprogrammet aRts. | --without-arts |
--with-alsa=check | Bygger ALSA-ljudinsticksprogrammet | --with-alsa=no |
--with-gstreamer=no | Bygger inte Gstreamer-ljudinsticksprogrammet | --with-gstreamer=check |
--with-akode=no | Bygger inte aKode-ljudinsticksprogrammet | --with-akode=check |
I KDE 4, kommer troligen insticksprogrammet aRts tas bort eller åtminstone inte byggas som förval.
Följande insticksprogram för talsyntes byggs alla normalt. Vissa av dem beror bara på icke-fri programvara vid körning (icke-fri enligt Debians policy). Kolumnen "Väljare till configure för att inte bygga" visar kommandot till configure för att inte bygga insticksprogrammet.
Talsyntes | Licens | Inställningsalternativ för att inte bygga |
Festival | fri | --disable-kttsd-festivalint |
Festival Lite | fri | --disable-kttsd-flite |
Epos | fri | --disable-kttsd-epos |
Kommando | fri | --disable-kttsd-command |
Hadifix | icke-fri | --disable-kttsd-hadifix |
FreeTTS | icke-fri | --disable-kttsd-freetts |
Normalt installerar kommandona ovan KTTS i /opt/kde3. Om katalogen inte finns i sökvägen $KDEDIRS
, kan du behöva lägga till väljaren --prefix=
. Till exempel:mål
./configure --prefix=/usr/local make
På Debian-system är
det vanliga stället att installera program som kompileras från källkod. /usr/local
Logga in som systemadministratör och installera det kompilerade KTTS med följande kommandon:
su make install
Om du laddade ner källkoden för KTTS från modulen kdeaccessibility
i kodarkivet, eller laddade ner det komprimerade arkivet som skapas varje natt, använd följande kommandon för att kompilera och installera.
cd kdeaccessibility echo kttsd >inst-apps make -f Makefile.cvs ./configure cd kttsd make su make install
Försäkra dig om att ditt talsyntesprogram fungerar innan du använder KTTS. Följ instruktionerna som levererades med programmet.
I vissa fall måste du ge skrivåtkomst till ljudenheten.
chmod a+rw
/dev/dsp*
Festival är ett av de bättre fria text-till-tal programmen med öppen källkod som är tillgängliga. Röstkvalitet är i allmänhet bra och det finns stöd för en hel del språk och röster. För många röster kan du styra volym, det upplästa talets hastighet och tonhöjd från KTTS.
Syntesnamn: Festival interaktiv
Webbadress: http://www.cstr.ed.ac.uk/projects/festival/
Debian installationskommando: apt-get install festival
Du måste installera minst ett språk. Följ instruktionerna som levereras med Festival. Om du kommer att läsa upp webbsidor, måste du installera rösten rab_diphone (brittisk man).
Ytterligare engelska röster för Festival är tillgängliga från
Ytterligare spanska, engelska och tyska röster är tillgängliga från
http://cslu.cse.ogi.edu/tts/download/
Du måste kompilera ytterligare en modul för dessa röster, och därför måste du ha källkoden för Festival. De tyska rösterna har en begränsad distribution.
En finsk manlig röst är tillgänglig från
http://www.ling.helsinki.fi/suopuhe/download/.
En polsk manlig röst är tillgänglig från
http://www.artegence.com/download/voicexml/speech/festival_polish_voice.tgz.
En rysk manlig röst är tillgänglig från
http://nshmyrev.narod.ru/festival/festival.html
Du måste ha Festival 1.95 beta eller senare för att använda rösten. Rösten är fortfarande i en tidig utvecklingsfas. Packa upp i festival/lib/voices/russian/
. När du ställer in den ryska talaren, är röstkoden msu_ru_nsh_diphone
. Försäkra dig om att välja en 8-bitars kyrillisk kodning, såsom KOI8-R
.
Italienska röster för Festival 1.95 beta är tillgängliga på
http://www.csrf.pd.cnr.it/TTS/It-FESTIVAL-download.htm.
Om du får CRC-fel när du packar upp, försök ladda ner igen.
Kiswahili, zulu och ibibio röster för Festival 1.95 beta är tillgängliga på
Tyvärr fungerar inte Hindi rösten som också är tillgänglig här med KTTS.
Kommersiella röster, inklusive en franskkanadensisk röst, kan köpas av Cepstral, LLC på
Vanliga frågor på deras supportsida har information om hur deras röster används i Festival.
Festival ingår ofta i Linux®-distributioner. Kontrollera din distributions-cd för att se om det ingår.
När språken polska, ungerska eller tjeckiska används, försäkra dig om att alternativet Kodning är inställt till ISO 8859-2
.
När den ryska rösten används, försäkra dig om att alternativet Kodning är inställt till en 8-bitars kyrillisk kodning, till exempel KOI8-R
.
Festival kan användas i kombination med MBROLA-talsyntes. I detta läge gör Festival lexikalanalysen och MBROLA skapar ljudet. MBROLA-binärfilen och MBROLA-röstfiler kan laddas ner från
Följ instruktionerna i filen readme.txt
som ingår i nerladdningen.
Observera att MBROLA inte är ett fullständig system för text-till-tal. MBROLA syntetiserar tal från difonfiler. Du måste ha ytterligare programvara som kan skapa difonerna. Vid kombination med Festival, skapar Festival difonerna som MBROLA behöver. txt2pho kan också användas för att skapa difoner från tysk text. Se Användning med Hadifix för mer information.
Det finns tre metoder för att kombinera Festival med MBROLA.
MBROLA-omgivning. När den här handboken skrivs, är metoden begränsad till engelska röster.
Med den här metoden läggs ytterligare omgivningskod till i Festival för att möjliggöra talsyntes med MBROLA röstfiler. Observera att MBROLA-röstfilerna inte installeras i MBROLA-katalogträdet. Istället installeras de i katalogträdet festival/lib. För instruktioner, se
IMS tyska Festival är en ändrad version av Festival som använder tyska MBROLA-röster. Den fungerar antingen med Festival version 1.4.1 eller Festival 2.0 (1.95 beta). Installera först Festival och MBROLA, om du inte redan har gjort det. Ladda därefter ner IMS tyska Festival från
http://www.ims.uni-stuttgart.de/phonetik/synthesis/festival_opensource.html.
Följ instruktionerna i filen README
som ingår i nerladdningen. (Observera: om det används tillsammans med Festival 2.0, är det inte nödvändigt att installera det komprimerade arkivet fixes
, men du måste ändå bygga om Festival.) Lägg till sist till följande rader i filen festival/lib/siteinit.scm
.
(voice-location "german_de1_os" "/usr/local/mbrola/de1" "German Female, IMS Festival de1") (voice-location "german_de2_os" "/usr/local/mbrola/de2" "German Male, IMS Festival de2") (voice-location "german_de3_os" "/usr/local/mbrola/de3" "German Female, IMS Festival de3")
precis ovanför raden som lyder
(provide 'siteinit)
(På vissa system, är filen du redigerar /etc/festival.scm
.) Lägg bara till raderna som motsvarar de tyska röster som du har installerat. Ersätt
med rätt sökväg. Observera också att IMS tyska Festival inte fungerar med de tyska rösterna de4, de5 eller de6 (när det här skrivs)./usr/local/mbrola
Den här metoden använder en del speciell kod för att aktivera talsyntes med användning av Festival och en MBROLA tjeckisk röst. För att installera den, ladda först ner och installera Festival och MBROLA och försäkra dig om att båda fungerar. Ladda därefter ner tjeckiska Festival från
http://www.freebsoft.org/festival-czech
Ersätt riktiga katalogsökvägar efter behov i följande procedurer.
Packa upp nerladdningen i en lämplig katalog och bygg ordboken. Den körbara filen för Festival måste finnas i din PATH
.
cd /usr/local tar xvfz festival-czech.tar.gz cd festival-czech make
Ladda ner röstfilen cz2
från MBROLA:s webbplats, och packa upp den i MBROLA:s katalog.
cd /usr/local/mbrola mkdir cz2 cd cz2 unzip cz2-001009.zip
Lägg till följande rader i filen festival/lib/siteinit.scm
:
(set! czech-lexicon-file "/usr/local/festival-czech/czech-lexicon.out") (set! load-path (cons "/usr/local/festival-czech" load-path)) (require 'czech) (set! czech-mbrola_database "/usr/local/mbrola/cz2/cz2") (set! mbrola_progname "/usr/local/mbrola/mbrola") (voice-location "czech_mbrola_cz2" "/usr/local/mbrola/cz2" "Czech Male, MBROLA") (require 'czech-mbrola)
precis ovanför raden som lyder
(provide 'siteinit)
(På vissa system är filen du redigerar /etc/festival.scm
)
Festival Lite är ett fritt program med öppen källkod som för närvarande stöder ett begränsat antal röster och språk. Det är lättviktigt, men offrar i viss mån röstkvalitet. Du kan inte styra tonhöjd, volym eller hastighet för programmet från KTTS.
Syntesnamn: Festival Lite (flite)
Webbadress: http://www.speech.cs.cmu.edu/flite/index.html
Debian installationskommando: apt-get install flite
Programmet flite ingår ofta i Linux®-distributioner. Kontrollera din distributions-cd för att se om det ingår.
Bygg och installera flite genom att följa instruktionerna i filen README
som levereras med det.
Hadifix är ett tvåstegs talsyntesprogram baserat på difoner. Verktyget txt2pho konverterar text till difoner och programmet MBROLA syntetiserar difonerna till ljud. Röstkvaliteten är bra, men språkstödet är för närvarande något begränsat. Du kan styra röst, tonhöjd, hastighet och volym från kttsmgr.
Syntesnamn: Hadifix
Webbadress: se nedan
Debian installationskommando: inget
Om du inte redan har installerat Hadifix, gör följande:
Ladda ner MBROLA-binarfiler från http://festvox.org/mbrola/.
Installera MBROLA i katalogen /usr/local/mbrola
.
Ladda ner minst en tysk språkfil från MBROLA-platsen. Packa upp den i katalogen /usr/local/mbrola
.
Ladda ner txt2pho från
http://www.ikp.uni-bonn.de/dt/forsch/phonetik/hadifix/HADIFIXforMBROLA.html.
Packa upp txt2pho till /usr/local/txt2pho
.
Redigera filen txt2phorc, och lägg till riktiga datavägar.
Kopiera antingen txt2phorc till ~/.txt2phorc
eller till /etc/txt2pho
. Observera att du tar bort "rc" från filnamnet.
Välj språket tyska i kttsmgr (de), och lägg till Hadifix.
På skärmen Anpassa talare, ställ in en röst och sökvägarna till MBROLA och txt2pho.
Klicka på knappen för att testa.
En ungersk implementering av MBROLA och txt2pho är tillgänglig på
Epos är ett fritt tjeckiskt och slovakiskt program med öppen källkod. Det är lättviktigt, men offrar i viss mån röstkvalitet. Du kan inte styra volym för programmet från KTTS.
Syntesnamn: Epos text-till-tal syntessystem
Webbadress: http://epos.ure.cas.cz/
Debian installationskommando: apt-get install epos
Starta kttsmgr. Klicka på knappen Lägg till på sidan Talare. Välj språket tjeckiska eller slovakiska och Epos text-till-tal syntessystem. Om den körbara Epos-servern och klienten inte finns i din sökväg, skriv in fullständiga sökvägar till dessa körbara program på sidan Anpassa talare. Alternativrutorna tillåter dig att skicka ytterligare väljare till servern och klienten. Skriv epos -h eller say -h i en terminal för information.
FreeTTS är ett fritt talsyntesprogram med öppen källkod skrivet i Java™, vilket betyder att du måste ha Java™ virtuella maskin installerad i ditt system för att använda den. Den har för närvarande begränsat stöd för röster och språk. Du kan inte styra tonhöjd, volym eller hastighet för programmet från KTTS.
Syntesnamn: FreeTTS
Webbadress: http://sourceforge.net/projects/freetts/
Debian installationskommando: inget
Insticksprogrammet för kommando tillåter att du använder KTTS med vilket talsyntesprogram som helst som kan köras som ett kommando i en terminal.
Syntesnamn: Kommando
Webbadress: ingen
Debian installationskommando: inget
Idealiskt bör du använda ett kommando som syntetiserar till en tillfällig ljudfil (wav), istället för att direkt skicka talet till ljudenheten.
Om talsyntesprogrammet kräver att text ska ha en annan kodning från skrivbordets kodningsinställning, måste du använda väljaren %f för att skicka texten till programmet. KTTS kodar texten med inställningen du anger när det skriver texten till den tillfälliga filen. Om du försöker skicka text på kommandoraden med väljaren %t, kodas den med kodningsinställningen i skrivbordets landsinställning. Du kan också använda alternativet Skicka data som standardinmatning för att lösa problemet, om programmet accepterar indata från standardinmatningen. Här är ett exempel på ett kommando för att skicka polsk text till Festival med kodningen ISO 8859-2 och ta bort interpunktionstecken som inte ska läsas upp.
cat %f | tr '(){}[]"' ' ' | festival --tts --language polish
Would you like to make a comment or contribute an update to this page?
Send feedback to the KDE Docs Team