Národní úložiště šedé literatury Nalezeno 52 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Vztah emocí a intonačních křivek
Gavlasová, Radka ; Smékal, Zdeněk (oponent) ; Tučková,, Jana (vedoucí práce)
Tato práce se zabývá intonačními křivkami s jejími vztahy pro různé emoce. Kromě teoretického základu, který pojednává o tvorbě řeči, zpracování signálů a psychologického nastínění rozdělení emocí, obsahuje také tvorbu vlastní emotivní databáze realizované s profesionálními herci. Cílem této závěrečné práce je klasifikace signálu na základě emoce, kterou nahrávka má představovat. Těmito emocemi jsou hněv, radost, nuda a smutek. Klasifikace probíhala pomocí umělých neuronových sítí, konkrétně v aplikaci Classification Learner, kterou poskytuje programovací prostředí Matlab. Použité příznaky pro tuto metodu byly variace fundamentální frekvence a MFCC. Výsledky byly následně porovnány a zanalyzovány poslechovým testem. Tento test pomohl určit, zda jsou výsledky relevantní pro tuto problematiku. Maximální úspěšnost trénování sítě dosáhla přibližně 82 %, testování pak 75 %. Poslechové testy potvrdily, že výsledky odpovídají předpokládanému lidskému vnímání. Pro podrobnější a lepší vyhodnocení, by bylo zapotřebí větší a kvalitnější databáze.
Rozpoznání typu přenosového kanálu z řečového signálu
Kopřiva, Tomáš ; Burget, Radim (oponent) ; Atassi, Hicham (vedoucí práce)
Práce se zabývá rozpoznáním pěti odlišných řečových přenosových kanálů. Použité kanály jsou: GSM, dva PSTN a dva VoIP kanály. Pro účely testování a trénování je vytvořena pro přenosové kanály řečová databáze SPLAB_TranCh. Řečové nahrávky z tohoto korpusu pochází z databáze TIMIT a každá promluva prošla každým přenosovým kanálem. Hlavním cílem práce je nalezení optimálních příznaků a klasifikátorů, které poskytují nejvyšší úspěšnost klasifikace. Je vyzkoušeno několik typů příznaků, včetně MFCC, LPCC a spektrálních charakteristik. Nejlepší suprasegmentální příznaky byly určeny algoritmem mRMR. Také bylo otestováno několik klasifikátorů. Výsledky ukazují, že rozpoznání přenosových kanálů může být realizováno s vysokou úspěšností (okolo 90 %). Práce také zkoumá vliv zkreslení, které může nastat během přenosu, na úspěšnost klasifikace. Jsou uvažovány následující typy zkreslení: saturace, prahování, ozvěna, praskání a vliv filtrů a různých barev šumů.
Řízení a měření sportovních drilů hlasem/zvuky
Odehnal, Jiří ; Křivka, Zbyněk (oponent) ; Rychlý, Marek (vedoucí práce)
Tato diplomová práce se zabývá návrhem a vývojem mobilní aplikace pro platformu Android. Cílem práce je implementovat jednoduché a přívětivé uživatelské rozhraní, které by podporovalo a napomáhalo uživateli v provádění cvičebních sad a cvičebních úkonů. Součástí práce je i implementace podpory detekce zvuků během provádění cviků a předávání hlasových pokynů uživateli. V praxi má aplikace napomoci v pohodlném provádění cvičebních sestav, aniž by byl uživatel nucen mít mobilní zařízení stále v ruce.
Rozpoznávání řeči pro vybrané jazyky
Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce)
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.
Rozpoznávání řeči (číslice)
Kantar, Martin ; Minář, Petr (oponent) ; Matoušek, Radomil (vedoucí práce)
V bakalářské práci vysvětluji, jak samotná řeč vypadá a co jí ovlivňuje. Zmiňuji zde nejčastěji používané metody, kterými si řečové signály můžeme připravit pro rozpoznávání. Na názorných příkladech ukazuji, na jakých principech dnešní rozpoznávače řeči pracují, jaké mají výhody a nevýhody. Pro metodu založenou na učení neuronových sítí jsem vytvořil v prostředí Matlabu řečový rozpoznávač číslovek 0-9.
Analýza zvukových nahrávek pomocí hlubokého učení
Kramář, Denis ; Říha, Kamil (oponent) ; Přinosil, Jiří (vedoucí práce)
Tato diplomová práce se zabývá řešením problému audio-klasifikace zvuku těžby motorové pily v přirozeném prostředí s využitím převážně konvolučních neuronových sítí. Nejprve je probrána teorie týkající se grafické reprezentace zvukového signálu. Další část je věnována oblasti strojového učení. Ve třetí kapitole jsou prezentovány některé současné práce zabývající se touto problematikou. V rámci praktické části je představen použitý dataset a testované neuronové sítě. Dosažené výsledky testování jsou porovnány na základě dosažené úspěšnosti a pomocí křivek ROC. Robustnost představených řešení je ověřena pomocí navrženého detekčního programu a zhodnocena pomocí objektivních kritérií.
Rozpoznávání a klasifikace emocí na základě analýzy řeči
Černý, Lukáš ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Diplomová práce se soustředí na klasifikaci emocí. Práce pojednává o parametrizaci zvukových souborů pomoci segmentálních a suprasegmentálních metod s ohledem na jejich další použití. Tato databáze obsahuje mnoho zvukových nahrávek s emocemi. Z těchto zvukových nahrávek jsou vytvořeny data, které jsou rozděleny do dvou částí. První část je použita pro trénik a druhá pro klasifikaci. Práce je soustředěna hlavně na samoorganizující sítě. Tato práce obsahuje programy v Matlabu, které mohou být použity pro parametrizaci jakékoliv databáze. Parametrizovaná data jsou předložena samoorganizující síťi ke klasifikaci. Dosažené výsledky jsou prezentovány na konci diplomové práce.
Algoritmy rozpoznávání řeči na FPGA/DSP
Urbiš, Oldřich ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
Tato diplomová práce  se zabývá návrhem algoritmů pro rozpoznání řeči s ohledem na výběr cílové technologie, kterou je platforma využívající technologie signálových procesorů a programovatelných hradlových polí. Algoritmy pro rozpoznávání řeči zahrnují, extrakci příznaků v podobě Melfrekvenčních cepstrálních koeficientů, skryté  Markovovy modely a jejich vyhodnocení pomocí Viterbiho algoritmu.
Systém pro rozpoznání hlasových povelů v reálném čase
Šíbl, Evžen ; Kiac, Martin (oponent) ; Přinosil, Jiří (vedoucí práce)
Bakalářská práce se zabývá tvorbou systému pro rozpoznání hlasových povelů. Klasifikátor tohoto systému byl vytvořený pomocí neuronové sítě. V práci se obeznámíte s historií a problematiku rozpoznání řeči. Byl vytvořený systém, který detekuje v nahrávce úsek obsahující řečový signál, který následně pomocí klasifikátoru rozhodne o jaké slovo z tabulky slov se jedná. Byly vytvořeny 3 modely se stejnou architekturou avšak s různými trénovacími daty. Tyto modely byly následně porovnány mezi sebou. Pro výsledný systém bylo vytvořené jednoduché uživatelské rozhraní.
Analýza a rozpoznání logopedických vad v řečovém projevu
Diviš, Jan ; Atassi, Hicham (oponent) ; Smékal, Zdeněk (vedoucí práce)
Bakalářská práce se zabývá logopedickou vadou dyslalií a její charakteristikou. Dále je popsán proces vytváření a reprezentace řeči. V práci jsou představeny základy zpracování a analýzy řečového signálu ( LPC, kepstrální, MFCC). V programu MATLAB jsou provedena zobrazení charakteristik řeči a výpočty LPC, kepstrálních a melovských koeficientů. Práce je především zaměřena na nesprávné vyslovování hlásek "r" a "ř".

Národní úložiště šedé literatury : Nalezeno 52 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.