Národní úložiště šedé literatury Nalezeno 53 záznamů.  předchozí3 - 12dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Rozpoznání typu přenosového kanálu z řečového signálu
Kopřiva, Tomáš ; Burget, Radim (oponent) ; Atassi, Hicham (vedoucí práce)
Práce se zabývá rozpoznáním pěti odlišných řečových přenosových kanálů. Použité kanály jsou: GSM, dva PSTN a dva VoIP kanály. Pro účely testování a trénování je vytvořena pro přenosové kanály řečová databáze SPLAB_TranCh. Řečové nahrávky z tohoto korpusu pochází z databáze TIMIT a každá promluva prošla každým přenosovým kanálem. Hlavním cílem práce je nalezení optimálních příznaků a klasifikátorů, které poskytují nejvyšší úspěšnost klasifikace. Je vyzkoušeno několik typů příznaků, včetně MFCC, LPCC a spektrálních charakteristik. Nejlepší suprasegmentální příznaky byly určeny algoritmem mRMR. Také bylo otestováno několik klasifikátorů. Výsledky ukazují, že rozpoznání přenosových kanálů může být realizováno s vysokou úspěšností (okolo 90 %). Práce také zkoumá vliv zkreslení, které může nastat během přenosu, na úspěšnost klasifikace. Jsou uvažovány následující typy zkreslení: saturace, prahování, ozvěna, praskání a vliv filtrů a různých barev šumů.
Řízení a měření sportovních drilů hlasem/zvuky
Odehnal, Jiří ; Křivka, Zbyněk (oponent) ; Rychlý, Marek (vedoucí práce)
Tato diplomová práce se zabývá návrhem a vývojem mobilní aplikace pro platformu Android. Cílem práce je implementovat jednoduché a přívětivé uživatelské rozhraní, které by podporovalo a napomáhalo uživateli v provádění cvičebních sad a cvičebních úkonů. Součástí práce je i implementace podpory detekce zvuků během provádění cviků a předávání hlasových pokynů uživateli. V praxi má aplikace napomoci v pohodlném provádění cvičebních sestav, aniž by byl uživatel nucen mít mobilní zařízení stále v ruce.
Rozpoznávání řeči pro vybrané jazyky
Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce)
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.
Rozpoznávání řeči (číslice)
Kantar, Martin ; Minář, Petr (oponent) ; Matoušek, Radomil (vedoucí práce)
V bakalářské práci vysvětluji, jak samotná řeč vypadá a co jí ovlivňuje. Zmiňuji zde nejčastěji používané metody, kterými si řečové signály můžeme připravit pro rozpoznávání. Na názorných příkladech ukazuji, na jakých principech dnešní rozpoznávače řeči pracují, jaké mají výhody a nevýhody. Pro metodu založenou na učení neuronových sítí jsem vytvořil v prostředí Matlabu řečový rozpoznávač číslovek 0-9.
Analýza zvukových nahrávek pomocí hlubokého učení
Kramář, Denis ; Říha, Kamil (oponent) ; Přinosil, Jiří (vedoucí práce)
Tato diplomová práce se zabývá řešením problému audio-klasifikace zvuku těžby motorové pily v přirozeném prostředí s využitím převážně konvolučních neuronových sítí. Nejprve je probrána teorie týkající se grafické reprezentace zvukového signálu. Další část je věnována oblasti strojového učení. Ve třetí kapitole jsou prezentovány některé současné práce zabývající se touto problematikou. V rámci praktické části je představen použitý dataset a testované neuronové sítě. Dosažené výsledky testování jsou porovnány na základě dosažené úspěšnosti a pomocí křivek ROC. Robustnost představených řešení je ověřena pomocí navrženého detekčního programu a zhodnocena pomocí objektivních kritérií.
Rozpoznávání a klasifikace emocí na základě analýzy řeči
Černý, Lukáš ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Diplomová práce se soustředí na klasifikaci emocí. Práce pojednává o parametrizaci zvukových souborů pomoci segmentálních a suprasegmentálních metod s ohledem na jejich další použití. Tato databáze obsahuje mnoho zvukových nahrávek s emocemi. Z těchto zvukových nahrávek jsou vytvořeny data, které jsou rozděleny do dvou částí. První část je použita pro trénik a druhá pro klasifikaci. Práce je soustředěna hlavně na samoorganizující sítě. Tato práce obsahuje programy v Matlabu, které mohou být použity pro parametrizaci jakékoliv databáze. Parametrizovaná data jsou předložena samoorganizující síťi ke klasifikaci. Dosažené výsledky jsou prezentovány na konci diplomové práce.
Algoritmy rozpoznávání řeči na FPGA/DSP
Urbiš, Oldřich ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
Tato diplomová práce  se zabývá návrhem algoritmů pro rozpoznání řeči s ohledem na výběr cílové technologie, kterou je platforma využívající technologie signálových procesorů a programovatelných hradlových polí. Algoritmy pro rozpoznávání řeči zahrnují, extrakci příznaků v podobě Melfrekvenčních cepstrálních koeficientů, skryté  Markovovy modely a jejich vyhodnocení pomocí Viterbiho algoritmu.
Systém pro rozpoznání hlasových povelů v reálném čase
Šíbl, Evžen ; Kiac, Martin (oponent) ; Přinosil, Jiří (vedoucí práce)
Bakalářská práce se zabývá tvorbou systému pro rozpoznání hlasových povelů. Klasifikátor tohoto systému byl vytvořený pomocí neuronové sítě. V práci se obeznámíte s historií a problematiku rozpoznání řeči. Byl vytvořený systém, který detekuje v nahrávce úsek obsahující řečový signál, který následně pomocí klasifikátoru rozhodne o jaké slovo z tabulky slov se jedná. Byly vytvořeny 3 modely se stejnou architekturou avšak s různými trénovacími daty. Tyto modely byly následně porovnány mezi sebou. Pro výsledný systém bylo vytvořené jednoduché uživatelské rozhraní.
Analýza a rozpoznání logopedických vad v řečovém projevu
Diviš, Jan ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Bakalářská práce se zabývá logopedickou vadou dyslalií a její charakteristikou. Dále je popsán proces vytváření a reprezentace řeči. V práci jsou představeny základy zpracování a analýzy řečového signálu ( LPC, kepstrální, MFCC). V programu MATLAB jsou provedena zobrazení charakteristik řeči a výpočty LPC, kepstrálních a melovských koeficientů. Práce je především zaměřena na nesprávné vyslovování hlásek "r" a "ř".
Rozpoznávání řeči s pomocí nástroje Sphinx-4
Kryške, Lukáš ; Uher, Václav (oponent) ; Burget, Radim (vedoucí práce)
Tato diplomová práce se zabývá hledáním efektivní techniky pro strojové rozpoznávání řeči, konkrétně pak strojovým přepisem mluvené řeči do textu a následným hledáním klíčových slov. Toto řešení lze následně použit pro analýzy telefonních hovorů nebo jiné podobné aplikace. Celá diplomová práce se věnuje nástroji Sphinx-4 pro strojové rozpoznávání řeči, který využívá k popisu akustických modelů skrytých Markovových modelů (HMM – Hidden Markov Model). Práce detailně vysvětluje, jak takové modely připravit pro nový jazyk nebo dialekt jazyka a jak tyto modely softwarově implementovat v jazyce Java.

Národní úložiště šedé literatury : Nalezeno 53 záznamů.   předchozí3 - 12dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.