Lineární predikční a kepstrální syntéza řečového signálu v systému TTS
Linear prediciton and cepstral synthesis of speech signal in the TTS system
Mekyska, Jiří ; Stejskal, Vojtěch (referee) ; Smékal, Zdeněk (advisor) Document type: Bachelor's theses
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
Práce se zabývá lineární predikční a kepstrální syntézou řečového signálu v systémech TTS (Text-to-Speech) s možností modelování prozodie. Je zde uveden popis řečového signálu v akustické a fonetické rovině, princip tvorby řeči a způsob znázornění řečového signálu v časové a kmitočtové oblasti. Dále je zde uvedena bloková stavba TTS systémů, přičemž každý blok je zvlášť detailně popsán. V práci je také popsána problematika modelování prozodie pomocí tří nejdůležitějších suprasegmentálních rysů (základní tón, trvání a intenzita řeči). Na konci je proveden návrh a realizace univerzálního českého TTS systému, který je založen na syntéze řeči v kmitočtové oblasti. Tento systém je implementován v programu MATLAB.
This work deals with a linear prediction and cepstral synthesis of speech signal in the TTS (Text-to-Speech) systems with the opportunity of modeling the prosody. The work contains a description of speech signal in acoustic and phonetic plane, the principle of speech production and the way we can figure the speech signal in time and frequency domain. Next, there is the TTS block structure mentioned, whereas each block has its own detailed description. In the work, the modeling of prosody using the three most important suprasegmental features (fundamental tone, continuation and speech intensity) is also described. At the end of this work, there is a design and realization of universal Czech TTS system which is based on the speech synthesis in frequency domain. This system is implemented in program MATLAB.
analysis; cepstrum; emotion; filter; formant; frequency; linear prediction; Matlab.; phonetic transcription; prosody; Speech; synthesis; TTS system; vocal tract; analýza; emoce; filtr; fonetická transkripce; formant; hlasový trakt; kepstrum; kmitočet; lineární predikce; Matlab.; prozodie; syntéza; TTS systém; Řeč
Institution: Brno University of Technology
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/17577