Název:
Odhad formantových kmitočtů pomocí strojového učení
Překlad názvu:
Estimation of formant frequencies using machine learning
Autoři:
Káčerová, Erika ; Galáž, Zoltán (oponent) ; Mekyska, Jiří (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2019
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [slo][eng]
Diplomová práca sa zoberá problematikou odhadu formantových kmitočtov. V prostredí Matlab je vytvorený systém, ktorý generuje databázu referenčných hodnôt prvých troch formantových kmitočtov z nahrávok ľudskej reči. Pritom sú využité softvéry Praat a WaveSurfer(Snack). Zo zvukových súborov sú extrahované lineárne predikčné koeficienty a melovské kepstrálne koeficienty. Vytvorená databáza je použitá k trénovaniu modelu neurónovej siete. Model je v závere testovaný.
This Master's thesis deals with the issue of formant extraction. A system of scripts in Matlab interface is created to generate values of the first three formant frequencies from speech recordings with the use of Praat and Snack(WaveSurfer). Mel Frequency Cepstral Coefficients and Linear Predictive Coefficients are extracted from the audio files in order to be added to the database. This database is then used to train a neural network. Finally, the designed neural network is tested.
Klíčová slova:
Formant; Formant Frequencies; LPC; Machine Learning; Matlab; MFCC; Neural Networks; Praat; Speech; Speech Processing
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/177564