Název:
Analýza zvukových nahrávek pomocí hlubokého učení
Překlad názvu:
Deep learning based sound records analysis
Autoři:
Kramář, Denis ; Říha, Kamil (oponent) ; Přinosil, Jiří (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2021
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Tato diplomová práce se zabývá řešením problému audio-klasifikace zvuku těžby motorové pily v přirozeném prostředí s využitím převážně konvolučních neuronových sítí. Nejprve je probrána teorie týkající se grafické reprezentace zvukového signálu. Další část je věnována oblasti strojového učení. Ve třetí kapitole jsou prezentovány některé současné práce zabývající se touto problematikou. V rámci praktické části je představen použitý dataset a testované neuronové sítě. Dosažené výsledky testování jsou porovnány na základě dosažené úspěšnosti a pomocí křivek ROC. Robustnost představených řešení je ověřena pomocí navrženého detekčního programu a zhodnocena pomocí objektivních kritérií.
This master thesis deals with the problem of audio-classification of the chainsaw logging sound in natural environment using mainly convolutional neural networks. First, a theory of grafical representation of audio signal is discussed. Following part is devoted to the machine learning area. In third chapter, some of present works dealing with this problematics are given. Within the practical part, used dataset and tested neural networks are presented. Final resultes are compared by achieved accuracy and by ROC curves. The robustness of the presented solutions was tested by proposed detection program and evaluated using objective criteria.
Klíčová slova:
audiosignál; CNN; detekce; klasifikace; konvoluční neuronové sítě; LSTM; MFCC; nelegální kácení; neuronová síť; strojové učení; zpracování signálu; audio signal; classification; CNN; convolutional neural network; detection; illegal logging; LSTM; machine learning; MFCC; neural network; signal processing
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/197102