|
Ovládání počítače pomocí gest
Lacko, Peter ; Herout, Adam (oponent) ; Juránek, Roman (vedoucí práce)
Tato práce se zabývá tvorbou systému pro ovládání počítače přes webkameru pomocí gest, přičemž gesto je zde chápáno jako pohyb ruky utvářející nějaký vzor. V úvodu jsou popsány metody pro detekci ruky v obrazu, sledování ruky a pro vyhodnocení pohybu použity v této práci. Následuje popis systému a jeho implementace, provádění a vyhodnocení testů. Výstupem práce je program umožňující jednoduché ovládání prohlížeče dokumentů a multimediálního přehrávače.
|
| |
|
Zobrazování uživatelských výslovností pro elektronické slovníky
Pešán, Jan ; Chalupníček, Kamil (oponent) ; Černocký, Jan (vedoucí práce)
Tato bakalářská práce se pokouší nalézt nový směr vývoje v oblasti učebních schopností elektronických slovníků. V první části je uvedeno představení základní myšlenky možnosti učení výslovnosti pomocí vizualizace fonémů. Následuje kapitola zabývající se obecným úvodem do metod zpracování řeči využívaných v této práci jako např. HMM nebo Viterbiho algoritmus. Ve třetí kapitole jsou popsány nástroje, pomocí kterých byla provedena implementace celého systému. Další kapitola rozebírá podrobně použitou technologii neuronových sítí jako systému odhadu věrohodností fonémů, popisuje problém kompatibility fonémových sad a použité modely fonémů. Kapitola 5 popisuje konkrétně samotnou implementaci systému. Zde jsou také popsány nástroje použité k přípravě dat pro systém. Ve dvou závěrečných kapitolách je poté obsaženo krátké uživatelské testování společně se screenshoty a zhodnocením celého projektu. Zde jsou také nastíněny další možné cesty vývoje tohoto systému.
|
|
Rozpoznávání řeči pro vybrané jazyky
Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce)
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.
|
|
Rozpoznávání řeči (číslice)
Kantar, Martin ; Minář, Petr (oponent) ; Matoušek, Radomil (vedoucí práce)
V bakalářské práci vysvětluji, jak samotná řeč vypadá a co jí ovlivňuje. Zmiňuji zde nejčastěji používané metody, kterými si řečové signály můžeme připravit pro rozpoznávání. Na názorných příkladech ukazuji, na jakých principech dnešní rozpoznávače řeči pracují, jaké mají výhody a nevýhody. Pro metodu založenou na učení neuronových sítí jsem vytvořil v prostředí Matlabu řečový rozpoznávač číslovek 0-9.
|
|
Rozpoznávání řeči s pomocí nástroje Sphinx-4
Kryške, Lukáš ; Uher, Václav (oponent) ; Burget, Radim (vedoucí práce)
Tato diplomová práce se zabývá hledáním efektivní techniky pro strojové rozpoznávání řeči, konkrétně pak strojovým přepisem mluvené řeči do textu a následným hledáním klíčových slov. Toto řešení lze následně použit pro analýzy telefonních hovorů nebo jiné podobné aplikace. Celá diplomová práce se věnuje nástroji Sphinx-4 pro strojové rozpoznávání řeči, který využívá k popisu akustických modelů skrytých Markovových modelů (HMM – Hidden Markov Model). Práce detailně vysvětluje, jak takové modely připravit pro nový jazyk nebo dialekt jazyka a jak tyto modely softwarově implementovat v jazyce Java.
|
|
Predikce vazebních míst proteinu p53
Radakovič, Jozef ; Vogel, Ivan (oponent) ; Martínek, Tomáš (vedoucí práce)
Proteín p53, ktorý je kódovaný génom TP53 zohráva významnú úlohu v bunečnom cykle, ako regulátor transkripcie génov pri reakcii bunky na stresové podnety, čím funguje ako potláčateľ rakoviny. Pochopenie spôsobu jeho regulácie ako aj jeho väzby na regulovaný gén je jedným z hlavných záujmov moderného výskumu v genetike a bioinformatike. V prvej časti tejto práce predstavujeme nevyhnutné poznatky z molekulárnej biológie nutné k pochopeniu spôsobu regulácie proteínu p53 a úvod do analýzy a predikcie väzobných miest transkripčných faktorov. V druhej časti sa venujeme implementovaniu a testovaniu nami vytvoreného nástroja, ktorý bude schopný tieto väzobné miesta pre proteín p53 predikovať.
|
|
Klasifikace akustických signálů
Pospíšil, Aleš ; Balík, Miroslav (oponent) ; Atassi, Hicham (vedoucí práce)
Bakalářská práce se zaměřuje na problematiku automatické klasifikace hudebních žánrů. Nejprve je hodnocen současný stav řešení problému s odkazem na již vytvořené studie a získané poznatky jsou využity k vlastní práci. Předmětem řešení problému je shrnutí použitelných hudebních příznaků a také klasifikačních metod jako neuronové sítě a k-nejbližší soused. Vybrané klasifikační třídy jsou vážná hudba, elektro, jazz a rock. Výsledkem bakalářské práce je systém pro automatické rozpoznání hudebních žánrů, který bude použitelný a uživatelsky přístupný. Dosažené rozpoznavací výsledky do jisté míry respektují schopnosti lidského organismu právě hudební žánry rozpoznat.
|
|
Dekodér pro systém detekce klíčových slov
Krotký, Jan ; Míča, Ivan (oponent) ; Pfeifer, Václav (vedoucí práce)
Práce seznamuje čtenáře se základními vlastnostmi rozpoznávání lidské řeči, popisuje systémy pro detekci klíčových slov a blíže se věnuje návrhu jednotlivých bloků dekodéru rozdělených do tří kapitol. První z nich popisuje operace, které jsou se signálem prováděny před rozdělením na rámce, i samotnou segmentaci. Druhá kapitola popisuje výpočet krátkodobé energie, počtu průchodů nulou a výpočet autokorelačních, predikčních a Melovských kepstrálních koeficientů. Třetí kapitola, která se zabývá návrhem bloku dekodéru, popisuje rozpoznávání pomocí metody dynamického borcení času a metody založené na skrytých Markovových modelech. V závěrečné části práce je popsán návrh dekodérů pracujících s plynulou řeči a návrh jednoduchého dekodéru pracujícího s izolovanými slovy, který je na základě předcházejících kapitol sestrojen a otestován.
|
|
Moderní metody multimediálního vyučování
Mazal, Zdeněk ; Přinosil, Jiří (oponent) ; Pfeifer, Václav (vedoucí práce)
Obsahem práce je shrnutí výhod a nevýhod e-learningu, další část se zabývá problematikou vyhledáváním klíčových slov ve zvukových záznamech, kde je přehled používaných metod, fungujících vyhledávačů, jejich rozdělení a možnosti využití. Obsahuje také návrh, realizaci a výsledky úspěšnosti jednoduchého vyhledávače slov ve zvukovém záznamu programovaného v prosředí Matlab.
|