Národní úložiště šedé literatury Nalezeno 52 záznamů.  začátekpředchozí33 - 42další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Estimation of formant frequencies using machine learning
Káčerová, Erika ; Galáž, Zoltán (oponent) ; Mekyska, Jiří (vedoucí práce)
This Master's thesis deals with the issue of formant extraction. A system of scripts in Matlab interface is created to generate values of the first three formant frequencies from speech recordings with the use of Praat and Snack(WaveSurfer). Mel Frequency Cepstral Coefficients and Linear Predictive Coefficients are extracted from the audio files in order to be added to the database. This database is then used to train a neural network. Finally, the designed neural network is tested.
Řízení a měření sportovních drilů hlasem/zvuky
Odehnal, Jiří ; Křivka, Zbyněk (oponent) ; Rychlý, Marek (vedoucí práce)
Tato diplomová práce se zabývá návrhem a vývojem mobilní aplikace pro platformu Android. Cílem práce je implementovat jednoduché a přívětivé uživatelské rozhraní, které by podporovalo a napomáhalo uživateli v provádění cvičebních sad a cvičebních úkonů. Součástí práce je i implementace podpory detekce zvuků během provádění cviků a předávání hlasových pokynů uživateli. V praxi má aplikace napomoci v pohodlném provádění cvičebních sestav, aniž by byl uživatel nucen mít mobilní zařízení stále v ruce.
Detekce Akustického Prostředí z Řeči
Dobrotka, Matúš ; Glembek, Ondřej (oponent) ; Matějka, Pavel (vedoucí práce)
Téma tejto diplomovej práce je klasifikácia audio nahrávky do 15 tried akustických prostredí, v ktorých sa ľudia bežne nachádzajú. Práca popisuje 2 metódy založené na GMM a i-vektoroch a ich vzájomnú fúziu. Na dátach zo súťaže DCASE dosiahol najlepší GMM systém úspešnosť 60.4% a i-vektor systém 68.4%. Fúzia GMM systému a najlepšieho i-vektor systému výsledok ešte zlepšila na 69.3%, čo by v dobe súťaže stačilo na 20. miesto z 98 odovzdaných systémov z celého sveta.
Rozpoznání typu přenosového kanálu z řečového signálu
Kopřiva, Tomáš ; Burget, Radim (oponent) ; Atassi, Hicham (vedoucí práce)
Práce se zabývá rozpoznáním pěti odlišných řečových přenosových kanálů. Použité kanály jsou: GSM, dva PSTN a dva VoIP kanály. Pro účely testování a trénování je vytvořena pro přenosové kanály řečová databáze SPLAB_TranCh. Řečové nahrávky z tohoto korpusu pochází z databáze TIMIT a každá promluva prošla každým přenosovým kanálem. Hlavním cílem práce je nalezení optimálních příznaků a klasifikátorů, které poskytují nejvyšší úspěšnost klasifikace. Je vyzkoušeno několik typů příznaků, včetně MFCC, LPCC a spektrálních charakteristik. Nejlepší suprasegmentální příznaky byly určeny algoritmem mRMR. Také bylo otestováno několik klasifikátorů. Výsledky ukazují, že rozpoznání přenosových kanálů může být realizováno s vysokou úspěšností (okolo 90 %). Práce také zkoumá vliv zkreslení, které může nastat během přenosu, na úspěšnost klasifikace. Jsou uvažovány následující typy zkreslení: saturace, prahování, ozvěna, praskání a vliv filtrů a různých barev šumů.
Systém pro diarizaci mluvčích
Bradáč, Josef ; Atassi, Hicham (oponent) ; Míča, Ivan (vedoucí práce)
Systém pro diarizaci mluvčích má široké uplatnění na poli zpracování a analýzy řečových signálů. V této práci je rozebrán úvod do problematiky a následný postup pro navržení systému. Výsledkem práce je implementace samotného systému a jeho vyhodnocení na základě databáze nahrávek rozhovorů.
Aplikace statistické analýzy řeči pacientů s Parkinsonovou nemocí
Bijota, Jan ; Mžourek, Zdeněk (oponent) ; Galáž, Zoltán (vedoucí práce)
Tato diplomová práce se zabývá zpracováním řečového signálu osob postižených Parkinsonovou nemocí za účelem vytvoření statistického vzorku řečových parametrů, pomocí něhož bude možno rozdělit zkoumané osoby na parkinsoniky a neparkinsoniky. Tento statistický vzorek je tvořen na základě detekce hypokinetické dysartrie u osob postižených Parkinsonovou nemocí. V práci je rozebíráno předzpracování řečového signálu pomocí metody ustřednění a preemfáze a jeho rozdělení na části (segmentace). Následně je popsáno parametrické vyjádření zpracovávaného vzorku pomocí fonačních parametrů, MFCC a PLP koeficientů. Dále jsou rozebírány možnosti statistické analýzy pomocí zmíněného parametrického vyjádření. V přípádě této práce statistická analýza sestává z výpočtu Pearsonova a Spearmanova korelačního koeficientu, vzájemné informace a parametrického Studentova t-testu a neparametrického Mann-Whitneyova U testu. Výsledkem práce je soubor řečových parametrů pro jednotlivé dlouhé české samohlásky, které dokáží dle provedené statistické analýzy nejlépe vyjádřit rozdíl mezi zdravým řečníkem a parkinsonikem. Tyto výsledky mohou napomoci při diagnóze osoby, u níž je podezření na Parkisonovu nemoc.
Algoritmy rozpoznávání řeči na FPGA/DSP
Urbiš, Oldřich ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
Tato diplomová práce  se zabývá návrhem algoritmů pro rozpoznání řeči s ohledem na výběr cílové technologie, kterou je platforma využívající technologie signálových procesorů a programovatelných hradlových polí. Algoritmy pro rozpoznávání řeči zahrnují, extrakci příznaků v podobě Melfrekvenčních cepstrálních koeficientů, skryté  Markovovy modely a jejich vyhodnocení pomocí Viterbiho algoritmu.
Multiplatformní aplikace pro verifikaci mluvčího
Görig, Jan ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce)
Bakalářská práce se zabývá rozpoznáváním mluvčího bez znalosti textu sdělení. Zmiňuje dnes používané způsoby extrakce příznaků a jejich vyhodnocení pomocí směsice Gaussových hustotních funkcí. Praktickým výstupem práce je aplikace pro vizualizaci průběhu rozpoznávání. Návrh aplikace je multiplatformní a využívá knihoven Qt a BSAPI.
Rozpoznávání řeči pro vybrané jazyky
Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce)
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.
Analýza Parkinsonovy nemoci pomocí segmentálních řečových příznaků
Mračko, Peter ; Mekyska, Jiří (oponent) ; Smékal, Zdeněk (vedoucí práce)
V tejto práci je popísaný návrh systému diagnózy Parkinsonovej choroby na základe reči. Parkinsonova choroba je neurodegeneratívna porucha centrálneho nervového systému, ktorej prejavom je okrem iných aj postihnutie motorických aspektov reči tzv. hypokinetická dysartria. Návrh systému je v tejto práci založený na najznámejších segmentálnych parametroch ako sú koeficienty LPC, PLP, MFCC, LPCC, ale aj menej známych ako sú CMS, ACW a MSC. Z rečových nahrávok pacientov postihnutých Parkinsonovou chorobou, ale aj kontrolných jedincov, sú vypočítané tieto koeficienty, ktoré sú v ďalšom postupe podrobené selekcii a následne klasifikácii. Najlepší výsledok, ktorý bol v práci získaný, dosahoval presnosť klasifikácie 77,19%, senzitivitu 74,69% a špecificitu 78,95%.

Národní úložiště šedé literatury : Nalezeno 52 záznamů.   začátekpředchozí33 - 42další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.