Original title:
Změna rychlosti řeči
Translated title:
Modification of Speech Rate
Authors:
Kovářík, Aleš ; Schwarz, Petr (referee) ; Szőke, Igor (advisor) Document type: Master’s theses
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato diplomová práce pojednává o změně rychlosti řeči. Jako metoda pro změnu rychlosti byla v této práci použita PSOLA (Pitch Synchronous OverLap Add). PSOLA je algoritmus pracující v časové oblasti. Práce rovněž uvádí další metodu -- fázový vokodér pracující ve frekvenční oblasti. Tato práce dále rozšiřuje metodu PSOLA o fonémový rozpoznávač s úmyslem zvýšit srozumitelnost výsledné řeči vyhodnocením typu hlásek v mluveném projevu -- samohlásky, frikativy apod. Pro ověření kvalit navrženého propojení metody PSOLA a fonémového rozpoznávače byla vytvořena aplikace, která toto spojení realizuje.
This diploma thesis discusses modification of a speech rate. The PSOLA (Pitch Synchronous OverLap Add) method was used for the rate modification. This algorithm works in time domain. Another method -- phase vocoder, which works in frequency domain is also presented in an overview. This thesis extends the PSOLA method with a phoneme recognition, which allows for better understandability of the speech output by considering characteristics of the phonemes beeing pronounced. To examine this proposed method, an application connecting PSOLA and a phoneme recognizer was developed.
Keywords:
phoneme recongizer; PSOLA; rate; speech; speed; time domain; fonémový rozpoznávač; PSOLA; rychlost; časová oblast; řeč
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/54032