Název:
Analýza vlivu přítomnosti šumu v nahrávkách na automatizovanou detekci hypokinetické dysartrie
Překlad názvu:
Analysis of impact of noise in recordings on the automated detection of hypokinetic dysarthria
Autoři:
Havelková, Nikola ; Galáž, Zoltán (oponent) ; Kováč, Daniel (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2022
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Práce se zabývá analýzou vlivu přítomnosti šumu v nahrávkách na automatizovanou detekci hypokinetické dysartrie. Pro zvýraznění řeči jsou zvoleny a v prostředí MATLAB R2022a implementovány vhodné jednokanálové metody, a to konkrétně spektrální odečítání a Kalmanův filtr. Metody jsou rovněž použity i u nahrávek bez zatížení šumem, ke kterým byl přidán aditivní bílý šum. Účinnost těchto metod je pak hodnocena objektivně pomocí hodnot odstupu signálu od šumu. Po zvýraznění řeči jsou z nahrávek extrahovány řečové příznaky. Vliv přítomnosti šumu, a i jeho následné potlačení jednotlivými metodami, je následně vyhodnoceno statistickou analýzou, konkrétně za pomoci Kruskal-Wallisova testu a post-hoc Dunnova testu. Distribuce pravděpodobnosti parametrů nahrávek čistých, zašuměných i zvýrazněných, u nichž je dle statistických testů vliv šumu signifikantní, jsou vykresleny za pomoci houslových a krabicových grafů. Na závěr byla provedena klasifikace nahrávek logistickou regresí za pomoci strojového učení, kdy byl dle hodnot plochy pod ROC křivkou popsán vliv přítomnosti šumu a následné zvýraznění řeči na automatizovanou detekci hypokinetické dysartrie.
This thesis deals with the automated detection of hypokinetic dysarthria by analysing the influence of noise present in recordings. Appropriate single-channel methods, specifically the spectral subtraction and Kalman filter, are selected and implemented in the MATLAB R2022a to enhance speech. These methods are also used for noise-free recordings, to which additive white noise was added. Afterwards, the effectiveness of these methods is objectively evaluated by using signal-to-noise ratio values. After enhancing of speech, interferences are extracted from the recordings. The effect of the presence of noise, as well as its subsequent suppression by individual methods, is then evaluated by statistical analysis, specifically using the Kruskal-Wallis test and the post hoc Dunn’s test. The probability of distributing parameters of clean, noisy and enhanced recordings, for which the effect of noise is significant, according to statistical tests, are plotted using violin and box graphs. Finally, the classification was done by logistic regression with the help of machine learning, where the effect of the presence of noise and subsequent speech enhancement on automated detection of hypokinetic dysarthria was described according to the area values under the ROC curve.
Klíčová slova:
Hypokinetická dysartrie; Kalmanův filtr; logistická regrese; odstup signálu od šumu; spektrální odečítání; zvýraznění řeči; řečové příznaky; Hypokinetic dysarthria; Kalman filter; logistic regression; signal-to-noise ratio; spectral subtraction; speech enhancement; speech features
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/204982