Název:
Odhad základní frekvence řečového signálu
Překlad názvu:
Estimation of Fundamental Speech Frequency
Autoři:
Ráček, Tomáš ; Vlach, Jan (oponent) ; Vondra, Martin (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2008
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [slo][eng]
Bakalářská práce je zaměřena na studium algoritmů zabývajících se odhadem základní frekvence řečového signálu. První část je úvodem do problematiky řečového signálu a naznačuje co bude jádrem práce. Ve druhé části je vysvětlen charakter řečového signálu, proces jeho tvorby člověkem a modely na vytváření řeči. Kapitola č. 3 se zbývá zpracováním akustických signálů, do nějž patří předzpracování, segmentace a aplikace Hammingova okénka na samotný akustický řečový signál. Další kapitola popisuje základní frekvenci řečového signálu jako fyzikální veličinu a její odvození ze základní periody. Dále vznik základní frekvence v řečových orgánech, rozsah hodnot pro různé lidi, vlastnosti, které se sebou nese a nakonec možnosti jejího využití. Kapitola č. 5 se věnuje základním metodám na určení základní frekvence řeči v časové, frekvenční a kepstrální oblasti. Kapitola č. 6 obsahuje popis metod, jenž se využívají v případech, kdy je řečový signál znehodnocen šumem. V následující části je popsán návrh a realizaci vybraného algoritmu. Dále jsou uvedeny výsledky jenž byly dosaženy tímto algoritmem a jsou porovnány s výsledky obyčejné metody autokorelace. Závěrečná kapitola shrnuje celou práci a je v ní pojednáno o pokračování, rozšíření, či zdokonalení algoritmu.
The Bachelor thesis focuses on algorithms with respect to estimation of fundamental speech frequency. First part is introduce to the questions of speech signals and the thesis at this point gives a clue what the core is going to be about. In the second part the nature of speech signal is explained, as well as the process of it’s creation by a person and models for speech generation. In the chapter 3 processing of acoustic signals are described, where pre-processing, segmentation and application of Hamming window on the same acoustic speech signal are included. The next chapter reports on pitch speech frequency signal as a physical magnitude and it's derivation from the pitch period. Furthermore describes, fundamental frequency creation in speech organs, scale range for different people, properties that carries and finally possibilities of it’s usage. Chapter 5 deals with essential principles defining pitch speech frequency in time, frequency and cepstral domain. Chapter 6 contains description of principles, used in situations, where the speech signal is devalued by noise. In the next chapter author describes design and implementation of selected principle. Furthermore, author presents results that have been achieved with this specific principle and compares them to the results of ordinary autocorrelation principle. The final chapter summarises the thesis and discusses about possible further part, extension or improvement of the algorithm.
Klíčová slova:
autocorrelation; digital processing signal; filter bank; fundamental frequency of speech; Speech signal
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/17634