Original title:
Rozpoznávání řeči (číslice)
Translated title:
Speech Recognition (digit)
Authors:
Kantar, Martin ; Minář, Petr (referee) ; Matoušek, Radomil (advisor) Document type: Bachelor's theses
Year:
2012
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta strojního inženýrství Abstract:
[cze][eng]
V bakalářské práci vysvětluji, jak samotná řeč vypadá a co jí ovlivňuje. Zmiňuji zde nejčastěji používané metody, kterými si řečové signály můžeme připravit pro rozpoznávání. Na názorných příkladech ukazuji, na jakých principech dnešní rozpoznávače řeči pracují, jaké mají výhody a nevýhody. Pro metodu založenou na učení neuronových sítí jsem vytvořil v prostředí Matlabu řečový rozpoznávač číslovek 0-9.
The aim of this diploma thesis is to explain what speech is and what are its constituents. I mention commonly used methods which are used for preparation of signals which we use for recognition. Schematic examples show principles of current recognizers of speech, their advantages and disadvantages. I made speech recognition program for 0-9 numerals in Matlab for neural nets learning.
Keywords:
DTW; FFT; HMM; LPC; Matlab.; MFCC; neural network; parameterization; PLP; Speech recognition; DTW; FFT; HMM; LPC; Matlab.; MFCC; neuronové sítě; parametrizace; PLP; Rozpoznávání řeči
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/10606