Národní úložiště šedé literatury Nalezeno 132 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Implementation of Simple Speech Recognizer in a Web Browser
Crkoň, Jakub ; Glembek, Ondřej (oponent) ; Szőke, Igor (vedoucí práce)
The goal of this project is to implement simple speech recognizer for web browser. This paper describes fundamental components required for implementing speech recognizer and techniques which are used for optimization process of speech recognition in web browser. At first, the paper focuses on introduction of speech recognition theory. It describes individual parts and principles of speech recognizer. In next section, thesis describes design, implementation and principles of acceleration of speech recognizer with limited computing resources of web browser. The implementation is divided into modules making up the library for usage in web browser. The library is easily extendable and usable in various web applications. Finally, it discusses potential directions of development and usability of this project.
Speech Technology Application in Pronunciation Training and Foreign Language Learning
Barotová, Štěpánka ; Žmolíková, Kateřina (oponent) ; Szőke, Igor (vedoucí práce)
This diploma thesis deals with automatic English pronunciation assessment and error detection based on the Dynamic Time Warping (DTW) algorithm. It focuses on the improvement of an existing pronunciation training application and it proposes three areas of improvement: user interface, algorithm and corrective feedback. After various methods used for pronunciation assessment are discussed in the first part, the new design is introduced, the proposed system is described and three sets of experiments are performed. The experiments focus on phoneme-level error detection, syllable-level primary stress error detection and word-level intonation assessment and they are designed to be able to provide corrective feedback to the user. The last part of the thesis describes how all three areas of improvement were tested.
Rozpoznávač izolovaných slov pro ovládání elektronických slovníků
Hrdlička, Pavel ; Szőke, Igor (oponent) ; Grézl, František (vedoucí práce)
Tato bakalářská práce se zabývá sestavením rozpoznávače izolovaných slov pro elektronické slovníky. Fonémový rozpoznavač je realizován pomocí HTK (Hidden Markov Model Toolkit). Na začátku tohoto dokumentu jsou stanoveny základní cíle práce. V následující kapitole je teoretický rozbor, který se věnuje procesu rozpoznávání izolovaných slov pomocí skrytých Markovových modelů. Další kapitola se věnuje specifikaci řečových dat, která byla použita pro testování rozpoznávače. Dále jsou zde popsány další prostředky, které byly k dispozici pro sestavení rozpoznavače, jako modely, slovník a gramatika. Před sestavením rozpoznávače bylo třeba vyřešit převod mezi sadou fonémů která byla použita ve slovníku a mezi sadou, kterou používá rozpoznávač. Rozpoznavač byl nejprve sestaven s použitím 8~kHz modelů, později 16~kHz. Byly použity normalizační techniky a technika adaptace na mluvčího. Získaná data byla zpracována a výsledky jsou zhodnoceny v samostatné kapitole. V závěru je diskutováno, zda bylo dosaženo vytýčených cílů a jaké jsou další plány vývoje aplikace.
Integrace hlasových technologií na mobilní platformy
Černičko, Sergij ; Černocký, Jan (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem práce je seznámit se s metodami a technikami využívanými při zpracování řeči. Popsat současný stav výzkumu a vývoje řečových technologií. Navrhnout a implementovat serverový rozpoznávač řeči, který využívá BSAPI. Integrovat klienta, který bude využívat server pro rozpoznání řeči, do mobilních slovníků společnosti Lingea.
Nahrávaní telefonátu a vyhledávání pro Skype
Nytra, Jiří ; Szőke, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
Práce se zabývá vytvořením programu komunikujícím s aplikací Skype, který umožňuje nahrávat hovory, v nichž dokáže vyhledávat klíčová slova pomocí moderních technologií rozpoznávání řeči. V práci je představeno rozhraní a protokol pro komunikaci s programem Skype, nahrávání hovoru a metoda LVCSR pro vyhledávání klíčových slov.
Penetration Tests of Speaker Verification System
Wojnar, Filip ; Landini, Federico Nicolás (oponent) ; Plchot, Oldřich (vedoucí práce)
The aim of the thesis is to realize penetration tests of automatic speaker verification system with use of text-to-speech model. The thesis is focused on inner functioning of those systems and spoofing attacks against them. The thesis is also focused on speech synthesis. Later chapters are focused on realization of realized penetration tests and discussion about results they brought us.
Paralelní trénování neuronových sítí pro rozpoznávání řeči
Veselý, Karel ; Fousek, Petr (oponent) ; Burget, Lukáš (vedoucí práce)
Tato diplomová práce je zaměřena na paralelizaci trénování neuronových sítí pro rozpoznávání řeči. V rámci této diplomové práce byly implementovány a porovnány dvě strategie paralelizace. První strategií je paralelizace dat s využitím rozdělení trénování do několika POSIX vláken. Druhou strategií je paralelizace uzlů s využitím platformy pro obecné výpočty na grafických kartách CUDA. V případě první strategie bylo dosaženo 4x urychlení, v případě využití platformy CUDA bylo dosaženo téměř 10x urychlení. Pro trénování byl použit algoritmus Stochastic Gradient Descent se zpětným šířením chyb. Po krátkém úvodu následuje druhá kapitola práce, která je motivační a zasazuje probém do kontextu rozpoznávání řeči. Třetí kapitola práce je teoretická a diskutuje neuronové sítě a metodu trénování. Následující kapitoly jsou zaměřené na návrh a implementaci a popisují iterativní vývoj tohoto projektu. Poslední obsáhlá kapitola popisuje testovací systém a uvádí výsledky provedených experimentů. V závěru jsou krátce zhodnoceny dosažené výsledky a nastíněna perspektiva dalšího vývoje projektu.
Adaptace rozpoznávače řeči na datech bez přepisu
Švec, Ján ; Karafiát, Martin (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem práce je vytvořit a otestovat techniky pro adaptaci rozpoznávače řeči na audionahrávkach bez slovního přepisu. Nejprve připravíme data pro trenovaní rozpoznavače řeči a natrénujeme počáteční systém. Tímto rozpoznavačem přepišeme neznáma data a zaměříme se na experimentování s výběrem kvalitních adaptačních dat na základě míry kvality přepisu. Systém na nově vytvořené sadě přetrénujeme a vyhodnotíme úspešnost. Dále experimentujeme s množstvím adaptačních dat.
Využití ovládání domácích spotřebičů hlasem
Bubla, Lukáš ; Vojáček, Zdeněk (oponent) ; Lacko, Branislav (vedoucí práce)
Bakalářská práce je zaměřena na domácí automatizaci, konkrétně na ovládání hlasovými pokyny. Popisuje způsoby komunikace a ovládání automatizovaných soustav, a především problematiku počítačového rozpoznávání řeči pomocí různých metod. Zobrazuje konkrétní výrobek pro hlasové ovládání, vyvinutý českou společností Elko ep, s.r.o., dále pak v krátkosti nahlíží do problematiky ovládání gesty. V závěru práce porovnává výrobek od společnosti Elko ep, s.r.o. se zahraničními výrobky jiných společností a diskutuje výhody a nevýhody ovládání hlasem či gesty.
Rozpoznávání řeči pro vybrané jazyky
Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce)
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.

Národní úložiště šedé literatury : Nalezeno 132 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.