Original title:
Redukce šumu ve zvukovém signálu pomocí hlubokého učení
Translated title:
Audio signal denoising using deep learning
Authors:
Pacal, Tomáš ; Záviška, Pavel (referee) ; Mokrý, Ondřej (advisor) Document type: Bachelor's theses
Year:
2023
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Tato práce se zabývá odstraňováním šumu v audio signálu za použití hlubokého učení. Jsou zde popsány základní typy neuronových sítí a jejich využití v této oblasti. Možnosti implementace neuronových sítí jsou otestovány v prostředí Matlab a Python. Následně je navržen model neuronové konvoluční sítě, podle kterého jsou realizovány čtyři různé architektury konvolučních sítí, které byly poté trénovány a testovány na různých typech šumů. Na základě těchto testů byla vybrána jedna architektura, která byla společně s~metodou redukce šumu využívající vlnkové transformace podrobena srovnávacímu testu na nahrávce řeči a poté na hudební nahrávce. Výsledky jsou vyhodnoceny jak pomocí objektivních metrik kvality zvuku tak pomocí neformálního poslechového testu. Neuronová síť dosáhla lepších výsledků dle všech použitých metrik a v poslechovém testu.
This thesis deals with noise removal in audio signal using deep learning. The basic types of neural networks and their use in audio signal processing are described. The possibilities of implementing neural networks are tested in Matlab and Python. Subsequently, a~convolutional neural network model is proposed, according to which four different convolutional network architectures are implemented and then trained and tested on different types of noise. Based on these tests, one architecture was selected and subjected to a comparative test on a speech recording and then on a music recording, together with a noise reduction method using wavelet transform. The results are evaluated using both objective sound quality metrics and an informal listening test. The neural network achieved better results according to all the metrics used as well as in the listening test.
Keywords:
audio signal processing; convolution; deep learning; machine learning; Matlab; neural network; noise reduction; PEMO-Q; PESQ; Python; STOI; hluboké učení; konvoluce; Matlab; neuronová síť; PEMO-Q; PESQ; Python; redukce šumu; STOI; strojové učení; zpracování zvukového signálu
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/210881