Národní úložiště šedé literatury Nalezeno 134 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Využití ovládání domácích spotřebičů hlasem
Bubla, Lukáš ; Vojáček, Zdeněk (oponent) ; Lacko, Branislav (vedoucí práce)
Bakalářská práce je zaměřena na domácí automatizaci, konkrétně na ovládání hlasovými pokyny. Popisuje způsoby komunikace a ovládání automatizovaných soustav, a především problematiku počítačového rozpoznávání řeči pomocí různých metod. Zobrazuje konkrétní výrobek pro hlasové ovládání, vyvinutý českou společností Elko ep, s.r.o., dále pak v krátkosti nahlíží do problematiky ovládání gesty. V závěru práce porovnává výrobek od společnosti Elko ep, s.r.o. se zahraničními výrobky jiných společností a diskutuje výhody a nevýhody ovládání hlasem či gesty.
Rozpoznávání řeči pro vybrané jazyky
Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce)
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.
Rozpoznáváni standardních PILOT-CONTROLLER řídicích povelů v hlasové podobě
Kufa, Tomáš ; Polách, Petr (oponent) ; Honzík, Petr (vedoucí práce)
Obsahem této práce je aplikace rozpoznávání řeči na ATC povely. Volba metod a přístupů k automatickému rozpoznávání ATC povelů vychází z podrobné studie letového provozu. Protože neexistuje jednoznačné řešení, zvlášť v tak obsáhlém oboru jako je rozpoznávaní řeči, je v této práci realizován rozpoznávač založený na porovnávání se vzory (DTW) a je srovnán s volně dostupným systémem HTK z University v Camridge založeném na statistických metodách využívajících skryté Markovovy modely. Míra vhodnosti obou metod je podložena praktickým testováním a vyhodnocením výsledku.
Rozpoznání jednotlivých písmen ve zvukovém záznamu s využitím SOM
Malásek, Jan ; Honzík, Petr (oponent) ; Honzík, Petr (oponent) ; Pohl, Jan (vedoucí práce)
Bakalářská práce popisuje historické pozadí vývoje neuronových sítí a jejich použití při procesu rozpoznání řeči a uvádí do problematiky práce a učení neuronových sítí. Představuje tři vybrané systémy pro rozpoznání řečového signálu včetně vyhodnocení jejich úspěšnosti v experimentech, výhod a nevýhod. Zabývá se charakteristikou lidské řeči a systémy na její rozpoznávání. Nabízí pohled na spektra signálů různých typů hlásek a dává návod k programování neuronových sítí v prostředí MATLAB.
Rozpoznávání řeči (číslice)
Kantar, Martin ; Minář, Petr (oponent) ; Matoušek, Radomil (vedoucí práce)
V bakalářské práci vysvětluji, jak samotná řeč vypadá a co jí ovlivňuje. Zmiňuji zde nejčastěji používané metody, kterými si řečové signály můžeme připravit pro rozpoznávání. Na názorných příkladech ukazuji, na jakých principech dnešní rozpoznávače řeči pracují, jaké mají výhody a nevýhody. Pro metodu založenou na učení neuronových sítí jsem vytvořil v prostředí Matlabu řečový rozpoznávač číslovek 0-9.
Recognition of Multi-Talker Overlapping Speech Using Neural Networks
Hradil, Jaromír ; Švec, Ján (oponent) ; Žmolíková, Kateřina (vedoucí práce)
This work deals with the speech recognition of overlapping speakers using a neural network. It examines the problem of speech recognition from multiple speakers and the ways in which this problem is solved. Specifically, in addition to traditional components such as convolutional neural networks, LSTM, etc., it is also an application of special components: attention mechanism and gated convolution. And also the application of a technique called permutation invariant training. Part of this work is to apply these approaches to assigned training data, which consists of artificially created mixtures of two speakers reading articles from the Wall Street Journal. The next step was to train the respective architectures using the combinations of the elements mentioned above. The models in this work replace the acoustic model. There were two architectures using different types of attention mechanism and one without it. Experiments have shown that architectures using the attention mechanism in this type of task have not surpassed more traditional architecture by suffering from gated convolution. Nevertheless, they showed potential.
Hlasem ovládaná kalkulačka
Pavelek, Ota ; Szőke, Igor (oponent) ; Grézl, František (vedoucí práce)
Tato práce se zabývá implementací kalkulačky. Tuto kalkulačku lze ovládat jak hlasem, tak běžným způsobem. Rozpoznávání řeči je realizováno pomocí knihovny BSCORE. K rozpoznávači je vytvořena rozpoznávací síť, která rozpoznává pouze potřebná slova. Po rozpoznání zadaného výrazu se rozpoznaný výraz zobrazí uživateli, aby jej mohl uživatel (zejména v případě chybného rozpoznání) upravit. Výpočet výrazu probíhá na žádost uživatele. Cílem hlasového ovládání je učinit používání kalkulačky efektivnější a přístupnější pro handicapované uživatele.
Detekce chybné výslovnosti v mluvené řeči
Struhař, Michal ; Rajmic, Pavel (oponent) ; Sysel, Petr (vedoucí práce)
Práce se zabývá problematikou detekce chybné výslovnosti v mluvené řeči. Jedním z cílů této práce je výběr vhodných parametrizací. Jedná se o krátkodobou energii, funkci středního počtu průchodu signálu nulou, lineární prediktivní analýzu, perceptivní lineární prediktivní analýzu, metodu RASTA, kepstrální analýzu a melovské kepstrální koeficienty. Dalším cílem je konstrukce detektoru chybné výslovnosti na bázi DTW (dynamické borcení času) a umělé neuronové sítě. Samotná detekce probíhá na základě získaných příznaků z vybraných analýz a fonetického přepisu promluvy. Parametrizace, detektor i fonetická transkripce českého jazyka jsou implemetovány v simulačním prostředí MATLAB.
Voice Dialog System in Web Browser for Demonstration Purposes
Vlček, Pavol ; Glembek, Ondřej (oponent) ; Schwarz, Petr (vedoucí práce)
This thesis describes how to prepare and design a voice-controlled assistant(voicebot), which can be deployed on any website as a modern way to communicate with customers using internet browsers. The main emphasis is put on synchronization between voice dialog and the graphical interface of the website. The synchronization can be achieved by transferring bidirectional voice and text commands between client and server. This is achieved by using WebRTC technology with SIP as a signaling protocol. The thesis deals with a wide range of protocols and technologies as well as interconnecting VoIP telephony, computer networks, and Phonexia speech technologies based on machine learning. As a result, deployment of the voicebot can reduce costs on outgoing calls, ease agents of a FAQ burden, and increase customers' interest in the product/company.
Vizualizace výstupu z řečových technologií pro potřeby kontaktních center
Zhezhela, Oleksandr ; Szőke, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
Diplomová práce se zabývá vizualizací dat získaných pomocí řečových technologií pro potřeby kontaktních center. Jsou prozkoumány metody získávání informaci z řečových signálů a existující nástroje, které řeší podobné úlohy. Je analyzován rozsah dat, která lze z řečových technologií získat. Procesy a standardy používané v kontaktních centrech. Na základě požadavků pracovníků kontaktních center bylo implementováno uživatelské rozhraní pro vizualizaci dat a audio přehrávačznázorňující řečová data. Získané poznatky a řešení byly implementovány do nástroje Speech Analytics Server (SPAS).

Národní úložiště šedé literatury : Nalezeno 134 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.