Název:
Implementing and Improving a Speech Synthesis System
Překlad názvu:
Implementing and Improving a Speech Synthesis System
Autoři:
Beněk, Tomáš ; Szőke, Igor (oponent) ; Hannemann, Mirko (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2014
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
Tato práce se zabývá syntézou řeči z textu. V práci je podán základní teoretický úvod do syntézy řeči z textu. Práce je postavena na MARY TTS systému, který umožňuje využít existujících modulů k vytvoření vlastního systému pro syntézu řeči z textu, a syntéze řeči pomocí skrytých Markovových modelů natrénovaných na vytvořené řečové databázi. Bylo vytvořeno několik jednoduchých programů ulehčujících vytvoření databáze a přidání nového jazyka a hlasu pro MARY TTS systém bylo demonstrováno. Byl vytvořen a publikován modul a hlas pro Český jazyk. Byl popsán a implementován algoritmus pro přepis grafémů na fonémy.
This work deals with text-to-speech synthesis. A general theoretical introduction to TTS is~given. This work is based on the MARY TTS system which allows to use existing modules for the creation of an own text-to-speech system and a speech synthesis model using hidden Markov models trained on the created speech database. Several simple programs to ease database creation were created and adding a new language and voice to the MARY TTS system was shown hot to add. The Czech language module and voice for the MARY TTS system was created and published. An algorithm for grapheme-to-phoneme transcription was described and implemented.
Klíčová slova:
grapheme-to-phoneme transcription(GTP); HMM synthesis; HTK; HTS; letter-to-sound(LTS); Mary TTS system; speech synthesis; text-to-speech(TTS); grapheme-to-phoneme transcription(GTP); HMM syntéza; HTK; HTS; letter-to-sound(LTS); syntéza řeči; systém Mary TTS; text-to-speech(TTS)
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/53322