Národní úložiště šedé literatury Nalezeno 134 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Odezírání ze rtů pomocí hlubokých neuronových sítí
Kadleček, Josef ; Kišš, Martin (oponent) ; Hradiš, Michal (vedoucí práce)
Tato práce se zabývá současnými metodami pro přepis řeči na text a odezírání ze rtů za pomoci neuronových sítí. Následně se zabývá podobností architektur neuronových sítí operujících nad zvukem a videem při rozpoznávání řeči a porovnává dostupné audiovizuální datové sady. Výsledkem práce je sada experimentů porovnávající různé zásahy do modelu a jejich dopad na výsledky. Dále je součástí implementace systému pro přepis řeči (CER: 12.6 %) a pro odezírání ze rtů (CER: 57,7 %). Architektury obou systémů jsou založeny na extrakci příznaků pomocí konvolučních vrstev. Za nimi následují rekurentní vrstvy LSTM, další řada konvolučních vrstev a hodnotící funkce CTC. 
Algoritmy rozpoznávání řeči na FPGA/DSP
Urbiš, Oldřich ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
Tato diplomová práce  se zabývá návrhem algoritmů pro rozpoznání řeči s ohledem na výběr cílové technologie, kterou je platforma využívající technologie signálových procesorů a programovatelných hradlových polí. Algoritmy pro rozpoznávání řeči zahrnují, extrakci příznaků v podobě Melfrekvenčních cepstrálních koeficientů, skryté  Markovovy modely a jejich vyhodnocení pomocí Viterbiho algoritmu.
Modelování jazyka v rozpoznávání češtiny
Mikolov, Tomáš ; Černocký, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá problematikou jazykových modelů v oblasti automatického přepisu mluvené řeči. V teoretické části jsou rozebrány současně používané metody pro pokročilé jazykové modelování založené na statistickém přístupu - modely založené na třídách, na faktorech a na neuronových sítích. Následně je popsána implementace jazykového modelu založeného na dvou neuronových sítích. V závěru práce jsou uvedeny výsledky dosažené na Pražském a Brněnském mluveném korpusu (cca 1 170 000 slov) - redukce perplexity o zhruba 20%. Výsledky dosažené při reskórování N-best listů ukazují zlepšení při rozpoznávání spontánní řeči o více než 1%. V závěru práce jsou uvedeny možnosti využití práce, její možná rozšíření a také jsou uvedeny hlavní nevýhody současně používaných přístupů pro statistické jazykové modelování.
Implementace detektoru klíčových slov do mobilního telefonu (Symbian 60)
Cipr, Tomáš ; Schwarz, Petr (oponent) ; Szőke, Igor (vedoucí práce)
Detektor klíčových slov je jednou z aplikací automatického rozpoznávání řeči. Úkolem detektoru je určit, ve kterých místech souvislého toku řeči se vyskytují slova ze zadaného seznamu. Detektor klíčových slov najde řadu uplatnění mimo jiné i v mobilních telefonech, např. pro jejich ovládání hlasem. S nástupem OS Symbian se otevřela možnost jak detektor implementovat i pro tato zařízení. Zpráva popisuje jednak teoretická a odborná východiska realizace detektoru a také jeho následnou implementaci. Nejdříve je uveden operační systém Symbian s ohledem na praktické řešení úkolu. Dále je popsán způsob detekce klíčových slov od vstupního řečového signálu až po výstup, zda a která slova byla nalezena. Následně je prezentován objektový návrh detektoru a podrobněji popsána jeho implementace. Závěrem jsou shrnuty dosažené výsledky a nastíněn další vývoj.
Nové techniky v oblasti trénování neuronových sítí - Connectionist temporal classification
Gajdár, Matúš ; Švec, Ján (oponent) ; Karafiát, Martin (vedoucí práce)
Táto bakalárska práca sa zaoberá problematikou neurónových sietí a ich využití v oblasti rozpoznávania reči. Na začiatok si priblížime teóriu rozpoznávania reči, následne na to nadväzuje problematika neurónových sietí spojená s vysvetlením metódy connectionist temporal classification. V ďalšej časti sú popísané nástroje vďaka ktorým sme mohli uskutočniť trénovanie neurónových sietí, spojené s popisom jednotlivých experimentov, ktoré sme spraviliaby sme zistili vplyv metódy connectionist temporal classification na presnosť predpovedania správnych foném. V záverečnej časti sa nachádza zhrnutie práce a celkové zhodnotenie experimentov.
Voice Sample database design for speech recognition purposes
Grobelný, Petr ; Malý, Jan (oponent) ; Pfeifer, Václav (vedoucí práce)
This thesis deals with problems of speech recognition and creation of speech corpus, which will serve as a training or testing data for speech recognition system. Mentioned corpus is designed as a corpus of read speech. In theoretical part reader is acquainted with the term Speech Recognition and then is more deeply introduced to the problems. The practical part consists of a detailed description of read speech database creation. The very corpus is then presented on the attached data carrier. In the last part there is a documentation of the read speech corpus presented.
Systém pro rozpoznání hlasových povelů v reálném čase
Šíbl, Evžen ; Kiac, Martin (oponent) ; Přinosil, Jiří (vedoucí práce)
Bakalářská práce se zabývá tvorbou systému pro rozpoznání hlasových povelů. Klasifikátor tohoto systému byl vytvořený pomocí neuronové sítě. V práci se obeznámíte s historií a problematiku rozpoznání řeči. Byl vytvořený systém, který detekuje v nahrávce úsek obsahující řečový signál, který následně pomocí klasifikátoru rozhodne o jaké slovo z tabulky slov se jedná. Byly vytvořeny 3 modely se stejnou architekturou avšak s různými trénovacími daty. Tyto modely byly následně porovnány mezi sebou. Pro výsledný systém bylo vytvořené jednoduché uživatelské rozhraní.
Hlasové vypínání elektrických přístrojů
Rozsypálek, Lukáš ; Šebesta, Vladimír (oponent) ; Sigmund, Milan (vedoucí práce)
Diplomová práce ve své teoretické části pojednává o zpracování akustického signálu před samotným rozpoznáváním slov. Jsou zde popsány metody pro automatické rozpoznávání slov a získávání příznaků. Mezi tyto metody patří krátkodobá energie signálu, krátkodobá autokorelační funkce, lineární prediktivní analýza atd. V praktické části byl navržen software, který při vyslovení klíčového slova „zastav“ provede vypnutí přístroje. Ve druhé části byl tento software optimalizován pro reálné prostředí s rušením elektrických přístrojů.
Hlasem ovladaná mapa FIT
Huták, Petr ; Grézl, František (oponent) ; Szőke, Igor (vedoucí práce)
Tato bakalářská práce se zabývá návrhem a tvorbou navigačního systému po areálu Fakulty informačních technologií Vysokého učení technického v Brně s hlasovým ovládáním. Vysvětluje metody používané pro hledání nejkratší cesty na mapě, rozpoznávání řeči a popisuje existující navigační systémy s hlasovým ovládáním. Práce je zaměřena především na tvorbu uživatelského rozhraní s hlasovým ovládáním. Cílem hlasového ovládání je, aby použití tohoto navigačního systému bylo přístupné a efektivní na veřejném místě. Hlasové ovládání je realizováno pomocí knihovny BSAPI.
Rekurentní neuronové sítě pro rozpoznávání řeči
Nováčik, Tomáš ; Karafiát, Martin (oponent) ; Veselý, Karel (vedoucí práce)
Tato diplomová práce se zabývá implementací rekurentních neuronových sítí v prostředí jazyka lua za pomocí knihovny torch. Řeší problematiku trénování rekurentních neuronových sítí a to jak z hlediska optimální trénovací strategie, tak z hlediska urychlení trénovacího procesu. Zkoumá zakomponování technik batch normalizace a dropout do architektur rekurentních neuronových sítí. Jednotlivé typy rekurentních sítí jsou následně porovnány na úkolu rozpoznávání řeči prostřednictvým datové sady AMI, kde slouží pro modelování akustického modelu, a dochází ke srovnání s klasickou dopřednou neuronovou sítí. Nejlepší výsledek je dosažen prostřednictvým rekurentní neuronové sítě BLSTM. Následně dojde k natrénování rekurentních neuronových sítí prostřednictvím objektivní funkce CTC na databázi TIMIT, kde nejlepšího výsledku opět dosáhne BLSTM.

Národní úložiště šedé literatury : Nalezeno 134 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.