Original title:
Dereverberace založená na neuronových sítích
Translated title:
Neural Network Based Dereverberation
Authors:
Karlík, Pavol ; Černocký, Jan (referee) ; Žmolíková, Kateřina (advisor) Document type: Bachelor's theses
Year:
2018
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
V posledných rokoch sa rozrástlo využitie neurónových sietí v oblasti spracovania reči. Táto bakalárska práca sa zaoberá implementáciou a vyhodnocovaním algoritmu na odstránenie dozvuku (reverberácie), ktorý využíva hlboké neurónové siete pre odhad výkonového spektra z rečovej nahrávky. Tento algoritmus je založený na najmodernejšom algoritme, Weighted prediction error (WPE), ktorý dokáže zredukovať reverberáciu z rečovej nahrávky. Táto práca obsahuje sumarizáciu teórie o dereverberácii, neurónových sieťach a algoritme WPE. V tejto práci sa experimentovalo s rôznymi architektúrami neurónových sietí, ktoré následne boli natrénované na rozdielnych dátových sadách s rôznymi vlastnosťami. Výsledky experimentov ukazujú, že naša modifikácia WPE dosahuje lepších výsledkov ako konvenčný algoritmus, a to najmä pre situácie, v ktorých je dĺžka spracovaného signálu krátka.
In the past years, the usage of neural networks in speech processing has increased significantly. This thesis focuses on implementing and evaluating a speech dereverberation framework that utilizes a deep neural network (DNN) to estimate the power spectral density of the signal. The proposed framework is based on the state-of-the-art speech enhancement algorithm called Weighted prediction error (WPE), which is known to effectively reduce reverberation from the speech signal. This thesis summarizes the theory of dereverberation, neural networks and the Weighted prediction error algorithm. Different DNN architectures are experimented with and trained using different datasets with varying properties. The results have shown that our framework is able to outperform the conventional WPE, especially in situations where duration of processed signal is short.
Keywords:
deep neural networks; dereverberation; machine learning; Weighted prediction error; dereverberácia; hlboké neurónové siete; strojové učenie; Weighted prediction error
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/85041