Národní úložiště šedé literatury Nalezeno 11 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Lze použít automatické rozpoznávání řeči k hodnocení kvality řeči?
Nouza, Jan ; Vích, Robert ; Vondra, Martin
V příspěvku jsou shrnuty úlohy, ve kterých bylo testováno použití automatického rozpoznávání řeči k hodnocení kvality řeči, a to jak přirozené, tak syntetické. Kvalita řeči je zpravidla měřena pomocí subjektivních poslechových testů. Naším cílem bylo zjištění, zda tyto testy, které jsou časově náročné a vyžadují zkušenosti, je možno nahradit nebo doplnit technikou založenou na automatickém rozpoznávání řeči.
Konverze pohádkových hlasů pro TTS systém s kepstrálním popisem
Přibil, Jiří ; Přibilová, Anna
Náš poslední výzkum ke zlepšení kvality syntézy řeči byl zaměřen na implementaci pohádkových řečových stylů sloužících k vyjádření emočních stavů v rámci vícehlasé realizace TTS systému. Pohádkové řečové styly jsou užitečné v hlasových aplikací určených pro děti a také pro nevidomé. V tomto článku jsou popsány experimenty s konverzí pohádkových hlasů prováděné na krátkých promluvách z pohádek v slovenštině a češtině.
Návrh vhodných prozodických modelů pro dialogové systémy
Horák, Petr
Tento příspěvek se zabývá zlepšením modelování prozodie syntetické řeči pomocí zdokonaleného modelování průběhu základního tónu. Použití matematického modelu průběhu základního tónu může významně zjednodušit pravidla generování průběhu základního tónu a zvýšit přirozenost výsledné syntetické řeči. Lineárně predikční intonační model zabudovaný v TTS systému Epos používá buzení pomocí pravidel a společně s kvalitním trifonovým inventářem nabízí syntetickou řeč s vyšší přirozeností.
Současný stav vývoje českého TTS systému EPOS
Chaloupka, Zdeněk ; Horák, Petr
Tento příspěvek se zabývá současným stavem vývoje TTS systému Epos, který ve svých posledních verzích využívá MBROLA rozhraní pro syntezátory řeči popisující syntetickou řeč jako zřetězení hlásek s uvedenými délkami a tzv. prozodickými body. Tento formát s sebou přináší několik problémů souvisejících především s použitím řečového inventáře navrženého pro syntézu v časové oblasti metodou PSOLA.
Úvodní kurs počítačového zpracování řeči pro studenty bakalářského studia
Nouza, Jan
Článek představuje koncepci jednosemestrálního předmětu, který autor připravil a vyučoval během svého pobytu na ETH v Curychu v roce 2006.
Experimenty se vzájemnou záměnou řečových stylů s použitím lineárního mapování průběhu FO v časové oblasti
Přibil, Jiří ; Přibilová, Anna
V anotaci článku jsou popsány experimenty se vzájemnou záměnou řečových stylů prováděné na promluvách generovaných TTS systémem se základní prozodií. Prototypy řečových stylů odvozené z pěti emocionálnách stavů byly získány z promluv se shodným informačním obsahem. Problém s rozdílnou délkou prototypu a cílové věty byl řešen s použitím lineárního mapování v časové oblasti. Výsledky byly hodnoceny pomocí poslechových testů promluv po provedené resyntéze.
Možnosti modelování prozodie TTS systému Epos s použitím MBROLA rozhraní
Horák, Petr ; Chaloupka, Zdeněk
Příspěvek se zabývá možnostmi modelování prosodie v TTS systému EPOS. Cílem je vytvořit TTS systém, který je schopný modelovat trvání jednotlivých hlásek a tím dosáhnout snadného využití MBROLA kompatibilních českých hlasů. Epos je jazykově nezávislý systém pro převod textu do řeči (Text-To-Speech). Může být konfigurován v širokých mezích bez nutnosti nové kompilace. Využitím editovatelných pravidel pro každý krok syntézy nabízí Epos možnost sledování celého procesu a snadný postup při aplikaci změn.
Použití RLPC inventářů systému Festival v Eposu
Chaloupka, Zdeněk ; Horák, Petr
Cílem tohoto příspěvku je popsat možnosti implementace nových hlasů do text-to-speech (TTS) systému Epos. Pro implementaci jsme použili inventáře TTS systému Festival. Inventáře obsahují komprimované řečové jednotky v podobě koeficientů Residuálně Lineárního Predikčního Kódování (RLPC) a další nutné informace pro syntézu řeči. Text je předáván systému Epos v MBROLA formátu a je tedy možné přímo určovat délku hlásek i tvar prosodie.
Hodnocení změny hlasu v TTS systému s kepstrálním popisem
Přibil, Jiří ; Přibilová, Anna
Změnu hlasu (tj. modifikaci řečového signálu tak, aby zněl jako od různých mluvčí), nachází uplatnění při syntéze řeči, neboť pro každý nový hlas není zapotřebí vytvářet novou databázi řečových jednotek. To je velmi užitečné v případě použití v speciálních pomůckách pro nevidomé a slabozraké např. v Brazilském zápisníku na platformě Pocket PC. Příspěvek se zabývá hodnocením implementované metody změny hlasu v česko-slovenském TTS systému s kepstrálním popisem řečové databáze a kepstrální syntézou řeči.
Metody mapování frekvenční škály pro konverzi hlasu
Přibilová, Anna
Výskumná správa pojednává niekol'ko prístupov k mapovani u frekvenčnej mierky pre konverziu hlasu. Všetky uvádzané metódy možno použit' na transformáciu charakteristík medzi mužským, ženským a detským hlasom. Výhodou navrhnutých nelineárnych metód je možnost' ich implementácie v systémoch prevodu textu na reč s kepstrálnym popisom, kedže ostáva zachovaný počet bodov modifikovanej obálky rečového spektra pri metodách založených na rýchlej Fourierovej transformácii.

Národní úložiště šedé literatury : Nalezeno 11 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.