Original title:
Rozpoznání zvukových událostí pomocí hlubokého učení
Translated title:
Deep learning based sound event recognition
Authors:
Bajzík, Jakub ; Kiska, Tomáš (referee) ; Přinosil, Jiří (advisor) Document type: Master’s theses
Year:
2019
Language:
slo Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[slo][eng]
Táto práca sa zaoberá problematikou spracovania a rozpoznávania udalostí v zvukovom signále. Práca skúma možnosť využitia vizualizácie zvukového signálu a následné použitie konvolučných neurónových sietí ako klasifikátoru pre rozpoznanie v reálnom použití. Vybrané zvukové udalosti sú výstrely zo zbraní umiestnené do zvukového pozadia ako je ruch ulice, ľudský hlas, zvuky zvierat a iné formy náhodného šumového pozadia. Pred samotnou implementáciou je vytvorená rozsiahla databáza s rôznymi parametrami výstrelov najmä charakteru dozvuku a časovej polohy v rámci spracovávaného úseku. V práci sú použité voľne dostupné platformy Keras a TensorFlow pre prácu s neurónovými sieťami.
This paper deals with processing and recognition of events in audio signal. The work explores the possibility of using audio signal visualization and subsequent use of convolutional neural networks as a classifier for recognition in real use. Recognized audio events are gunshots placed in a sound background such as street noise, human voice, animal sounds, and other forms of random noise. Before the implementation, a large database with various parameters, especially reverberation and time positioning within the processed section, is created. In this work are used freely available platforms Keras and TensorFlow for work with neural networks.
Keywords:
machine learning; neural network; signal processing; Sound recognition
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/177562