Název:
Online detekce jednoduchých příkazů v audiosignálu
Překlad názvu:
Online detection of simple voice commands in audiosignal
Autoři:
Zezula, Miroslav ; Březina, Lukáš (oponent) ; Krejsa, Jiří (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2011
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta strojního inženýrství
Abstrakt: [cze][eng]
Tato práce popisuje vývoj hlasového modulu, který je schopen rozpoznávat jednoduché řečové povely na základě porovnání zvukového vstupu s uloženými vzory. První část práce obsahuje popis použitého algoritmu a ověření jeho funkčnosti. Algoritmus je založen na Mel-frekvenčních cepstrálních koeficientech a dynamickém borcení času. Dále je navržen hardware hlasového modulu, obsahující signálový kontrolér 56F805 firmy Freescale. Signál z mikrofonu je upraven operačními zesilovači a digitálním filtrem. Třetí část se zabývá vývojem software pro kontrolér a popisuje implementaci algoritmu v pevné řádové čárce s ohledem na omezené možnosti kontroléru. Závěrečná zkouška prokazuje použitelnost modulu v prostředí s nízkým obsahem šumu.
This thesis describes the development of voice module, that can recognize simple speech commands by comparation of input sound with recorded templates. The first part of thesis contains a description of used algorithm and a verification of its functionality. The algorithm is based on Mel-frequency cepstral coefficients and dynamic time warping. Thereafter the hardware of voice module is designed, containing signal controller 56F805 from Freescale. The signal from microphone is conditioned by operational amplifiers and digital filter. The third part deals with the development of software for the controller and describes the fixed point implementation of the algorithm, respecting limited capabilities of the controller. Final test proves the usability of voice module in low-noise environment.
Klíčová slova:
aliasing; dynamické borcení času; Mel-frekvenční cepstrální koeficienty; rozpoznávání řeči; signálový kontrolér 56F805; výpočty v pevné řádové čárce; aliasing; dynamic time warping; fixed point arithmetics; Mel-frequency cepstral coefficients; signal controller 56F805; speech recognition
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/4291