| |
| |
| |
|
Použití rozpoznávání řeči a rýmových testů k hodnocení českých systémů pro zpracování řeči
Vích, Robert ; Nouza, Jan
Srozumitelnost řeči je nejdůležitější ukazatel kvality řeči. V příspěvku je popsán návrh nového objektivního hodnocení srozumitelnosti algoritmů pro zpracování řeči, např. kódování, syntézy, zvýrazňování a konverse řeči. Je založen na automatickém rozpoznávání rýmových testů. Myšlenka je ilustrována porovnáním s poslechovým hodnocením českých rýmových testů a je použita na hodnocení srozumitelnosti českého systému pro převod textu na řeč a pro konversi hlasu.
|
|
Konverse hlasu
Vích, Robert ; Vondra, Martin
Jsou popsány různé metody konverse hlasu založené na nelineární transformaci spektrální obálky. Umožňují transformaci promluvy zdrojového mluvčího na promluvu cílového mluvčího. Algoritmus konverse hlasu je založen na spektrální analýze, kmitočtové transformaci, modifikaci spektrální obálky a na vysoce kvalitní kepstrální syntéze řeči. Popsaná konverse hlasu zahrnuje také změnu prosodie.
|
|
Lze použít automatické rozpoznávání řeči k hodnocení kvality řeči?
Nouza, Jan ; Vích, Robert ; Vondra, Martin
V příspěvku jsou shrnuty úlohy, ve kterých bylo testováno použití automatického rozpoznávání řeči k hodnocení kvality řeči, a to jak přirozené, tak syntetické. Kvalita řeči je zpravidla měřena pomocí subjektivních poslechových testů. Naším cílem bylo zjištění, zda tyto testy, které jsou časově náročné a vyžadují zkušenosti, je možno nahradit nebo doplnit technikou založenou na automatickém rozpoznávání řeči.
|
|
Konverze pohádkových hlasů pro TTS systém s kepstrálním popisem
Přibil, Jiří ; Přibilová, Anna
Náš poslední výzkum ke zlepšení kvality syntézy řeči byl zaměřen na implementaci pohádkových řečových stylů sloužících k vyjádření emočních stavů v rámci vícehlasé realizace TTS systému. Pohádkové řečové styly jsou užitečné v hlasových aplikací určených pro děti a také pro nevidomé. V tomto článku jsou popsány experimenty s konverzí pohádkových hlasů prováděné na krátkých promluvách z pohádek v slovenštině a češtině.
|
|
Návrh vhodných prozodických modelů pro dialogové systémy
Horák, Petr
Tento příspěvek se zabývá zlepšením modelování prozodie syntetické řeči pomocí zdokonaleného modelování průběhu základního tónu. Použití matematického modelu průběhu základního tónu může významně zjednodušit pravidla generování průběhu základního tónu a zvýšit přirozenost výsledné syntetické řeči. Lineárně predikční intonační model zabudovaný v TTS systému Epos používá buzení pomocí pravidel a společně s kvalitním trifonovým inventářem nabízí syntetickou řeč s vyšší přirozeností.
|
|
Současný stav vývoje českého TTS systému EPOS
Chaloupka, Zdeněk ; Horák, Petr
Tento příspěvek se zabývá současným stavem vývoje TTS systému Epos, který ve svých posledních verzích využívá MBROLA rozhraní pro syntezátory řeči popisující syntetickou řeč jako zřetězení hlásek s uvedenými délkami a tzv. prozodickými body. Tento formát s sebou přináší několik problémů souvisejících především s použitím řečového inventáře navrženého pro syntézu v časové oblasti metodou PSOLA.
|
| |