Original title:
Odhad formantových kmitočtů pomocí strojového učení
Translated title:
Estimation of formant frequencies using machine learning
Authors:
Káčerová, Erika ; Galáž, Zoltán (referee) ; Mekyska, Jiří (advisor) Document type: Master’s theses
Year:
2019
Language:
slo Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[slo][eng]
Diplomová práca sa zoberá problematikou odhadu formantových kmitočtov. V prostredí Matlab je vytvorený systém, ktorý generuje databázu referenčných hodnôt prvých troch formantových kmitočtov z nahrávok ľudskej reči. Pritom sú využité softvéry Praat a WaveSurfer(Snack). Zo zvukových súborov sú extrahované lineárne predikčné koeficienty a melovské kepstrálne koeficienty. Vytvorená databáza je použitá k trénovaniu modelu neurónovej siete. Model je v závere testovaný.
This Master's thesis deals with the issue of formant extraction. A system of scripts in Matlab interface is created to generate values of the first three formant frequencies from speech recordings with the use of Praat and Snack(WaveSurfer). Mel Frequency Cepstral Coefficients and Linear Predictive Coefficients are extracted from the audio files in order to be added to the database. This database is then used to train a neural network. Finally, the designed neural network is tested.
Keywords:
Formant; Formant Frequencies; LPC; Machine Learning; Matlab; MFCC; Neural Networks; Praat; Speech; Speech Processing
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/177564