Národní úložiště šedé literatury Nalezeno 10 záznamů.  Hledání trvalo 0.00 vteřin. 
Rozpoznávač izolovaných slov pro ovládání elektronických slovníků
Hrdlička, Pavel ; Szőke, Igor (oponent) ; Grézl, František (vedoucí práce)
Tato bakalářská práce se zabývá sestavením rozpoznávače izolovaných slov pro elektronické slovníky. Fonémový rozpoznavač je realizován pomocí HTK (Hidden Markov Model Toolkit). Na začátku tohoto dokumentu jsou stanoveny základní cíle práce. V následující kapitole je teoretický rozbor, který se věnuje procesu rozpoznávání izolovaných slov pomocí skrytých Markovových modelů. Další kapitola se věnuje specifikaci řečových dat, která byla použita pro testování rozpoznávače. Dále jsou zde popsány další prostředky, které byly k dispozici pro sestavení rozpoznavače, jako modely, slovník a gramatika. Před sestavením rozpoznávače bylo třeba vyřešit převod mezi sadou fonémů která byla použita ve slovníku a mezi sadou, kterou používá rozpoznávač. Rozpoznavač byl nejprve sestaven s použitím 8~kHz modelů, později 16~kHz. Byly použity normalizační techniky a technika adaptace na mluvčího. Získaná data byla zpracována a výsledky jsou zhodnoceny v samostatné kapitole. V závěru je diskutováno, zda bylo dosaženo vytýčených cílů a jaké jsou další plány vývoje aplikace.
Rozpoznávač hudebního stylu z MP3
Duchoň, Luboš ; Szőke, Igor (oponent) ; Grézl, František (vedoucí práce)
Tato bakalářská práce se zabývá detailním popisem zvukového formátu MP3 a návrhem rozpoznávače hudebních stylů z MP3 souborů, založeném na rozpoznávání pomocí skrytých Markovových modelů a koeficientů získaných přímo z MP3 souborů, s využitím nástrojů HTK.
Implementing and Improving a Speech Synthesis System
Beněk, Tomáš ; Szőke, Igor (oponent) ; Hannemann, Mirko (vedoucí práce)
This work deals with text-to-speech synthesis. A general theoretical introduction to TTS is~given. This work is based on the MARY TTS system which allows to use existing modules for the creation of an own text-to-speech system and a speech synthesis model using hidden Markov models trained on the created speech database. Several simple programs to ease database creation were created and adding a new language and voice to the MARY TTS system was shown hot to add. The Czech language module and voice for the MARY TTS system was created and published. An algorithm for grapheme-to-phoneme transcription was described and implemented.
Robustní detekce klíčových slov v řečovém signálu
Vrba, Václav ; Sysel, Petr (oponent) ; Atassi, Hicham (vedoucí práce)
Diplomová práce je rozdělena do dvou částí teoretické a praktické. V teoretické části je zaměřena na metody analýzy a rozpoznání řečových signálů. V praktické části byl vytvořen systém pro rozpoznávání izolovaných slov v prostředí Matlab nezávislý na mluvčím zvlášť pro muže a ženy. Dále byly vytvořeny dvě řečové databáze pro využití v kokpitu a proběhlo testování a evaluace včetně vlivu přidaného šumu.
Vícejazykový fonémový rozpoznávač
Vobr, Vojtěch ; Matějka, Pavel (oponent) ; Szőke, Igor (vedoucí práce)
Cílem, této diplomové práce je natrénovat fonémový rozpoznávač s fonémovou sadou, která vznikla spojením fonémových sad jazyků obsažených v databázi SpeechDat-E a zjistit, zda takovýto rozpoznávač bude podávat lepší výsledky než rozpoznávače natrénované pouze pro jediný jazyk. Tato práce pojednává o fonémových sadách, principech rozpoznávání jednotlivých fonémů pomocí rozpoznávačů založených na neuronových sítích, dále o způsobech rozpoznávání a identifikace mluveného jazyka a také o spojování fonémových sad jednotlivých jazyků. Dále je zde popsán postup trénování fonémového rozpoznávače a rozpoznávání fonémů.
Rozpoznávač izolovaných slov pro ovládání elektronických slovníků
Hrdlička, Pavel ; Szőke, Igor (oponent) ; Grézl, František (vedoucí práce)
Tato bakalářská práce se zabývá sestavením rozpoznávače izolovaných slov pro elektronické slovníky. Fonémový rozpoznavač je realizován pomocí HTK (Hidden Markov Model Toolkit). Na začátku tohoto dokumentu jsou stanoveny základní cíle práce. V následující kapitole je teoretický rozbor, který se věnuje procesu rozpoznávání izolovaných slov pomocí skrytých Markovových modelů. Další kapitola se věnuje specifikaci řečových dat, která byla použita pro testování rozpoznávače. Dále jsou zde popsány další prostředky, které byly k dispozici pro sestavení rozpoznavače, jako modely, slovník a gramatika. Před sestavením rozpoznávače bylo třeba vyřešit převod mezi sadou fonémů která byla použita ve slovníku a mezi sadou, kterou používá rozpoznávač. Rozpoznavač byl nejprve sestaven s použitím 8~kHz modelů, později 16~kHz. Byly použity normalizační techniky a technika adaptace na mluvčího. Získaná data byla zpracována a výsledky jsou zhodnoceny v samostatné kapitole. V závěru je diskutováno, zda bylo dosaženo vytýčených cílů a jaké jsou další plány vývoje aplikace.
Rozpoznávač hudebního stylu z MP3
Duchoň, Luboš ; Szőke, Igor (oponent) ; Grézl, František (vedoucí práce)
Tato bakalářská práce se zabývá detailním popisem zvukového formátu MP3 a návrhem rozpoznávače hudebních stylů z MP3 souborů, založeném na rozpoznávání pomocí skrytých Markovových modelů a koeficientů získaných přímo z MP3 souborů, s využitím nástrojů HTK.
Implementing and Improving a Speech Synthesis System
Beněk, Tomáš ; Szőke, Igor (oponent) ; Hannemann, Mirko (vedoucí práce)
This work deals with text-to-speech synthesis. A general theoretical introduction to TTS is~given. This work is based on the MARY TTS system which allows to use existing modules for the creation of an own text-to-speech system and a speech synthesis model using hidden Markov models trained on the created speech database. Several simple programs to ease database creation were created and adding a new language and voice to the MARY TTS system was shown hot to add. The Czech language module and voice for the MARY TTS system was created and published. An algorithm for grapheme-to-phoneme transcription was described and implemented.
Vícejazykový fonémový rozpoznávač
Vobr, Vojtěch ; Matějka, Pavel (oponent) ; Szőke, Igor (vedoucí práce)
Cílem, této diplomové práce je natrénovat fonémový rozpoznávač s fonémovou sadou, která vznikla spojením fonémových sad jazyků obsažených v databázi SpeechDat-E a zjistit, zda takovýto rozpoznávač bude podávat lepší výsledky než rozpoznávače natrénované pouze pro jediný jazyk. Tato práce pojednává o fonémových sadách, principech rozpoznávání jednotlivých fonémů pomocí rozpoznávačů založených na neuronových sítích, dále o způsobech rozpoznávání a identifikace mluveného jazyka a také o spojování fonémových sad jednotlivých jazyků. Dále je zde popsán postup trénování fonémového rozpoznávače a rozpoznávání fonémů.
Robustní detekce klíčových slov v řečovém signálu
Vrba, Václav ; Sysel, Petr (oponent) ; Atassi, Hicham (vedoucí práce)
Diplomová práce je rozdělena do dvou částí teoretické a praktické. V teoretické části je zaměřena na metody analýzy a rozpoznání řečových signálů. V praktické části byl vytvořen systém pro rozpoznávání izolovaných slov v prostředí Matlab nezávislý na mluvčím zvlášť pro muže a ženy. Dále byly vytvořeny dvě řečové databáze pro využití v kokpitu a proběhlo testování a evaluace včetně vlivu přidaného šumu.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.