Národní úložiště šedé literatury Nalezeno 6 záznamů.  Hledání trvalo 0.00 vteřin. 
Speaker Recognition Based on Long Temporal Context
Fér, Radek ; Matějka, Pavel (oponent) ; Černocký, Jan (vedoucí práce)
This work deals with temporal features for automated speaker recognition. We give overview of currently known temporal feature extraction methods and afterwards, we propose and preliminarily evaluate a general phoneme-level temporal feature extraction scheme based on factor analysis i-vector paradigm. Much effort has been made to reasonably represent temporal context and make speaker recognition systems more robust, namely speech prosody modeling. Our approach does not explicitly model any temporal parameters of speech, rather it uses the occurrence of neighboring frames as a source of temporal information. We test and analyze this method on standard evaluation database NIST SRE 2008. The results indicate, however, that for speaker recognition, no useful gain can be obtained using this technique. We describe and discuss this discovery at the end.
Hodnocení hybnosti mluvidel na základě akustické analýzy řeči
Novotný, Kryštof ; Galáž, Zoltán (oponent) ; Mekyska, Jiří (vedoucí práce)
Hypokinetická dysartrie je motorická porucha řeči, často přítomná při průběhu Parkinsonovi nemoci. Postihuje řečové ústrojí včetně artikulačních schopností. Existuje více řečových parametrů popisujících tuto oblast, proto se nabízí zabývat se jejich vzájemným srovnáním. Práce si klade za cíl navrhnout a popsat algoritmus pro výpočet parametrů artikulace, přizpůsobený českému jazyku, a následně porovnat jejich diskriminační sílu. Akustickou analýzu řeči v algoritmu zajišťuje program Praat a pro následné zpracování dat jsou použity základní algoritmy strojového učení jako Expectation-Maximization, Kmeans nebo lineární regrese. Pro vyhodnocení slouží Mann-Whitneyho U test a zástupci lineárních, nelineárních i souhrnných metod strojového učení s využitím křížové validace a vyvážené přesnosti. Výsledkem jsou skripty pro automatické nalezení hran Hellwagova vokalického trojúhelníku, pro výpočet artikulačních parametrů a pro jejich vyhodnocení. Výstupy analýzy dvou různých databází (PARCZ a CoBeN) dokazují, že mezi běžnou a dysartrickou řečí lze skutečně pozorovat rozdíly v artikulaci. Na základě vzájemného srovnávání výsledků je proto v práci navrženo, kterými parametry a modely strojového učení je vhodné se dále v souvislosti s touto problematikou zabývat.
Analýza poruch řeči u osob s rizikem rozvoje onemocnění s Lewyho tělísky
Novotný, Kryštof ; Kováč, Daniel (oponent) ; Mekyska, Jiří (vedoucí práce)
Nemoci spadající do rodiny onemocnění s Lewyho tělísky (jedny z nejčastěji se vyskytujících neurodegenerativních poruch) mají shodný patologický základ, ale jednotliví zástupci se liší ve svých klinických projevech. Různá onemocnění více či méně postihují mentální nebo fyzickou stránku pacienta. Tato práce předpokládá, že díky akustické analýze řeči je možné od sebe jednotlivá onemocnění odlišit, protože v mluvě pacientů se specifickými způsoby odráží poruchy kognitivní i motorické stránky člověka. Práce si klade za cíl popsat klinické rysy hlavních zástupců onemocnění s Lewyho tělísky, prozkoumat jejich dopad na řeč, navrhnout charakterizující akustické parametry a následně porovnat jejich diskriminační sílu. Jako vstupní data pro navržený algoritmus jsou použity řečové nahrávky z databází CoBeNa preLBD. Pro následné vyhodnocení slouží deskriptivní statistiky, Mann-Whitneyho U test, FDR korekce a model strojového učení XGBoost s využitím stratifikované křížové validace a vyvážené přesnosti. Výsledkem jsou skripty pro automatizovaný výpočet řečových parametrů z databáze a jejich vyhodnocení. Výstupy analýzy dokazují, že vybraná onemocnění od sebe a od zdravé kontroly lze skutečně rozeznat na základě projevů v řeči, a to již v prodromálních stádiích.
Assessing Movement of Articulatory Organs in Patients with Parkinson’s Disease
Novotný, K. ; Mekyska, J.
Hypokinetic dysarthria is a motor speech disorder often present during Parkinson’s disease. It affects the speech system, including articulatory abilities. There are several speech parameters describing this domain, so it is suggested to deal with their mutual comparison. This work aims to design and describe an algorithm for calculating the parameters of articulation, adapted for the Czech language, and then compare their discriminative power. The acoustic analysis of speech included in it is done via the Praat program and basic machine learning algorithms such as Expectation-Maximization, K-means and linear regression are used for the subsequent data processing. The Mann-Whitney U test, descriptive statistics and Random Forest machine learning model using cross-validation and balanced accuracy is used for evaluation. The results are scripts for automatic assessment of vowel space area, for calculating articulation parameters and for their evaluation. The outputs of the analysis of speech recording database prove that differences in articulation can indeed be observed between normal and dysarthric speech. Based on the mutual comparison of results, it is therefore proposed in the work which parameters are being appropriate for further dealing with this issue.
Hodnocení hybnosti mluvidel na základě akustické analýzy řeči
Novotný, Kryštof ; Galáž, Zoltán (oponent) ; Mekyska, Jiří (vedoucí práce)
Hypokinetická dysartrie je motorická porucha řeči, často přítomná při průběhu Parkinsonovi nemoci. Postihuje řečové ústrojí včetně artikulačních schopností. Existuje více řečových parametrů popisujících tuto oblast, proto se nabízí zabývat se jejich vzájemným srovnáním. Práce si klade za cíl navrhnout a popsat algoritmus pro výpočet parametrů artikulace, přizpůsobený českému jazyku, a následně porovnat jejich diskriminační sílu. Akustickou analýzu řeči v algoritmu zajišťuje program Praat a pro následné zpracování dat jsou použity základní algoritmy strojového učení jako Expectation-Maximization, Kmeans nebo lineární regrese. Pro vyhodnocení slouží Mann-Whitneyho U test a zástupci lineárních, nelineárních i souhrnných metod strojového učení s využitím křížové validace a vyvážené přesnosti. Výsledkem jsou skripty pro automatické nalezení hran Hellwagova vokalického trojúhelníku, pro výpočet artikulačních parametrů a pro jejich vyhodnocení. Výstupy analýzy dvou různých databází (PARCZ a CoBeN) dokazují, že mezi běžnou a dysartrickou řečí lze skutečně pozorovat rozdíly v artikulaci. Na základě vzájemného srovnávání výsledků je proto v práci navrženo, kterými parametry a modely strojového učení je vhodné se dále v souvislosti s touto problematikou zabývat.
Speaker Recognition Based on Long Temporal Context
Fér, Radek ; Matějka, Pavel (oponent) ; Černocký, Jan (vedoucí práce)
This work deals with temporal features for automated speaker recognition. We give overview of currently known temporal feature extraction methods and afterwards, we propose and preliminarily evaluate a general phoneme-level temporal feature extraction scheme based on factor analysis i-vector paradigm. Much effort has been made to reasonably represent temporal context and make speaker recognition systems more robust, namely speech prosody modeling. Our approach does not explicitly model any temporal parameters of speech, rather it uses the occurrence of neighboring frames as a source of temporal information. We test and analyze this method on standard evaluation database NIST SRE 2008. The results indicate, however, that for speaker recognition, no useful gain can be obtained using this technique. We describe and discuss this discovery at the end.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.