keywords:"mfcc" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"mfcc"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Estimation of formant frequencies using machine learning Káčerová, Erika ; Galáž, Zoltán (oponent) ; Mekyska, Jiří (vedoucí práce) This Master's thesis deals with the issue of formant extraction. A system of scripts in Matlab interface is created to generate values of the first three formant frequencies from speech recordings with the use of Praat and Snack(WaveSurfer). Mel Frequency Cepstral Coefficients and Linear Predictive Coefficients are extracted from the audio files in order to be added to the database. This database is then used to train a neural network. Finally, the designed neural network is tested. Úplný záznam
	Řízení a měření sportovních drilů hlasem/zvuky Odehnal, Jiří ; Křivka, Zbyněk (oponent) ; Rychlý, Marek (vedoucí práce) Tato diplomová práce se zabývá návrhem a vývojem mobilní aplikace pro platformu Android. Cílem práce je implementovat jednoduché a přívětivé uživatelské rozhraní, které by podporovalo a napomáhalo uživateli v provádění cvičebních sad a cvičebních úkonů. Součástí práce je i implementace podpory detekce zvuků během provádění cviků a předávání hlasových pokynů uživateli. V praxi má aplikace napomoci v pohodlném provádění cvičebních sestav, aniž by byl uživatel nucen mít mobilní zařízení stále v ruce. Úplný záznam
	Detekce Akustického Prostředí z Řeči Dobrotka, Matúš ; Glembek, Ondřej (oponent) ; Matějka, Pavel (vedoucí práce) Téma tejto diplomovej práce je klasifikácia audio nahrávky do 15 tried akustických prostredí, v ktorých sa ľudia bežne nachádzajú. Práca popisuje 2 metódy založené na GMM a i-vektoroch a ich vzájomnú fúziu. Na dátach zo súťaže DCASE dosiahol najlepší GMM systém úspešnosť 60.4% a i-vektor systém 68.4%. Fúzia GMM systému a najlepšieho i-vektor systému výsledok ešte zlepšila na 69.3%, čo by v dobe súťaže stačilo na 20. miesto z 98 odovzdaných systémov z celého sveta. Úplný záznam
	Rozpoznání typu přenosového kanálu z řečového signálu Kopřiva, Tomáš ; Burget, Radim (oponent) ; Atassi, Hicham (vedoucí práce) Práce se zabývá rozpoznáním pěti odlišných řečových přenosových kanálů. Použité kanály jsou: GSM, dva PSTN a dva VoIP kanály. Pro účely testování a trénování je vytvořena pro přenosové kanály řečová databáze SPLAB_TranCh. Řečové nahrávky z tohoto korpusu pochází z databáze TIMIT a každá promluva prošla každým přenosovým kanálem. Hlavním cílem práce je nalezení optimálních příznaků a klasifikátorů, které poskytují nejvyšší úspěšnost klasifikace. Je vyzkoušeno několik typů příznaků, včetně MFCC, LPCC a spektrálních charakteristik. Nejlepší suprasegmentální příznaky byly určeny algoritmem mRMR. Také bylo otestováno několik klasifikátorů. Výsledky ukazují, že rozpoznání přenosových kanálů může být realizováno s vysokou úspěšností (okolo 90 %). Práce také zkoumá vliv zkreslení, které může nastat během přenosu, na úspěšnost klasifikace. Jsou uvažovány následující typy zkreslení: saturace, prahování, ozvěna, praskání a vliv filtrů a různých barev šumů. Úplný záznam
	Systém pro diarizaci mluvčích Bradáč, Josef ; Atassi, Hicham (oponent) ; Míča, Ivan (vedoucí práce) Systém pro diarizaci mluvčích má široké uplatnění na poli zpracování a analýzy řečových signálů. V této práci je rozebrán úvod do problematiky a následný postup pro navržení systému. Výsledkem práce je implementace samotného systému a jeho vyhodnocení na základě databáze nahrávek rozhovorů. Úplný záznam
	Aplikace statistické analýzy řeči pacientů s Parkinsonovou nemocí Bijota, Jan ; Mžourek, Zdeněk (oponent) ; Galáž, Zoltán (vedoucí práce) Tato diplomová práce se zabývá zpracováním řečového signálu osob postižených Parkinsonovou nemocí za účelem vytvoření statistického vzorku řečových parametrů, pomocí něhož bude možno rozdělit zkoumané osoby na parkinsoniky a neparkinsoniky. Tento statistický vzorek je tvořen na základě detekce hypokinetické dysartrie u osob postižených Parkinsonovou nemocí. V práci je rozebíráno předzpracování řečového signálu pomocí metody ustřednění a preemfáze a jeho rozdělení na části (segmentace). Následně je popsáno parametrické vyjádření zpracovávaného vzorku pomocí fonačních parametrů, MFCC a PLP koeficientů. Dále jsou rozebírány možnosti statistické analýzy pomocí zmíněného parametrického vyjádření. V přípádě této práce statistická analýza sestává z výpočtu Pearsonova a Spearmanova korelačního koeficientu, vzájemné informace a parametrického Studentova t-testu a neparametrického Mann-Whitneyova U testu. Výsledkem práce je soubor řečových parametrů pro jednotlivé dlouhé české samohlásky, které dokáží dle provedené statistické analýzy nejlépe vyjádřit rozdíl mezi zdravým řečníkem a parkinsonikem. Tyto výsledky mohou napomoci při diagnóze osoby, u níž je podezření na Parkisonovu nemoc. Úplný záznam
	Algoritmy rozpoznávání řeči na FPGA/DSP Urbiš, Oldřich ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce) Tato diplomová práce se zabývá návrhem algoritmů pro rozpoznání řeči s ohledem na výběr cílové technologie, kterou je platforma využívající technologie signálových procesorů a programovatelných hradlových polí. Algoritmy pro rozpoznávání řeči zahrnují, extrakci příznaků v podobě Melfrekvenčních cepstrálních koeficientů, skryté Markovovy modely a jejich vyhodnocení pomocí Viterbiho algoritmu. Úplný záznam
	Multiplatformní aplikace pro verifikaci mluvčího Görig, Jan ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce) Bakalářská práce se zabývá rozpoznáváním mluvčího bez znalosti textu sdělení. Zmiňuje dnes používané způsoby extrakce příznaků a jejich vyhodnocení pomocí směsice Gaussových hustotních funkcí. Praktickým výstupem práce je aplikace pro vizualizaci průběhu rozpoznávání. Návrh aplikace je multiplatformní a využívá knihoven Qt a BSAPI. Úplný záznam
	Rozpoznávání řeči pro vybrané jazyky Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce) Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů. Úplný záznam
	Analýza Parkinsonovy nemoci pomocí segmentálních řečových příznaků Mračko, Peter ; Mekyska, Jiří (oponent) ; Smékal, Zdeněk (vedoucí práce) V tejto práci je popísaný návrh systému diagnózy Parkinsonovej choroby na základe reči. Parkinsonova choroba je neurodegeneratívna porucha centrálneho nervového systému, ktorej prejavom je okrem iných aj postihnutie motorických aspektov reči tzv. hypokinetická dysartria. Návrh systému je v tejto práci založený na najznámejších segmentálnych parametroch ako sú koeficienty LPC, PLP, MFCC, LPCC, ale aj menej známych ako sú CMS, ACW a MSC. Z rečových nahrávok pacientov postihnutých Parkinsonovou chorobou, ale aj kontrolných jedincov, sú vypočítané tieto koeficienty, ktoré sú v ďalšom postupe podrobené selekcii a následne klasifikácii. Najlepší výsledok, ktorý bol v práci získaný, dosahoval presnosť klasifikácie 77,19%, senzitivitu 74,69% a špecificitu 78,95%. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English