Národní úložiště šedé literatury Nalezeno 38 záznamů.  začátekpředchozí29 - 38  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Rekurentní neuronové sítě pro rozpoznávání řeči
Nováčik, Tomáš ; Karafiát, Martin (oponent) ; Veselý, Karel (vedoucí práce)
Tato diplomová práce se zabývá implementací rekurentních neuronových sítí v prostředí jazyka lua za pomocí knihovny torch. Řeší problematiku trénování rekurentních neuronových sítí a to jak z hlediska optimální trénovací strategie, tak z hlediska urychlení trénovacího procesu. Zkoumá zakomponování technik batch normalizace a dropout do architektur rekurentních neuronových sítí. Jednotlivé typy rekurentních sítí jsou následně porovnány na úkolu rozpoznávání řeči prostřednictvým datové sady AMI, kde slouží pro modelování akustického modelu, a dochází ke srovnání s klasickou dopřednou neuronovou sítí. Nejlepší výsledek je dosažen prostřednictvým rekurentní neuronové sítě BLSTM. Následně dojde k natrénování rekurentních neuronových sítí prostřednictvím objektivní funkce CTC na databázi TIMIT, kde nejlepšího výsledku opět dosáhne BLSTM.
Sada JavaAppletů pro demonstraci zpracování řeči
Kudr, Michal ; Karafiát, Martin (oponent) ; Černocký, Jan (vedoucí práce)
Cílem práce je seznámit se s metodami a technikami využívanými při zpracování řeči. Pomocí získaných znalostí navrhuji tři JavaApplety demonstrující vybrané metody.  V této práci můžeme nalézt teoretický rozbor vybraných problémů.
Automatické jazzové aranžmá
Chadim, Petr ; Karafiát, Martin (oponent) ; Fapšo, Michal (vedoucí práce)
Práce pojednává o aranžování melodie, která je doplněna jazzovými akordy. Zabývá se vytvořením dalších harmonických hlasů pomocí metody blokové harmonizace. Rozdělení na cílové a přechodové noty je provedeno pomocí techniky programování s omezujícími podmínkami (CSP). Přechodové noty jsou reharmonizovány dominantním septakordem nebo paralelním akordem. Pomocí CSP je také vytvořen basový part. Pro řešení CSP je použita knihovna Gecode. Harmonické hlasy jsou aranžovány čtyřhlasou úzkou harmonií. Výsledek aplikace slouží jako pomůcka pro hudebního aranžéra.
Kdy kdo mluví?
Tomášek, Pavel ; Karafiát, Martin (oponent) ; Matějka, Pavel (vedoucí práce)
Práce se věnuje implementaci diarizace mluvčího. Popisuje jednotlivé komponenty diarizačního systému, který umí zodpovědět otázku "kdy kdo mluví". Mezi součásti takového systému patří postupně extrakce příznaků vstupních dat, detekce řeči/ticha, segmentace mluvčích, jejich následné shlukování a nakonec i techniky zaměřené na zlepšení finální segmentace. Práce pochopitelně uvádí i dosažené výsledky implementovaného systému na testovací sadě nahrávek včetně popisu způsobu hodnocení. Testovací nahrávky pochází z NIST RT evaluací z let 2005 - 2007 a nejnižší dosažená chybovost na této sadě je 18,52% DER. K porovnání výsledků systému na testovací sadě souborů je zde uvedena i úspěšnost Marijna Huijbregtse z Nizozemí, který v roce 2009 pracoval se stejnými nahrávkami a dosáhl chybovosti 12,91% DER.
Diarizace meetingové řeči - Kdo mluví kdy
Tůma, Radovan ; Konečný, Matej (oponent) ; Karafiát, Martin (vedoucí práce)
Tato práce obsahuje návrh diarizačního systému. Systém je postaven na bázi BIC (Bayesian Information Criterion). Ve zprávě naleznete stručný popis dříve vyvíjených systémů a stručnou teorii popisující, jak by diarizační systém měl pracovat. Práce se pokouší zohlednit dřívejších prací jiných autorů a výsledkem by měl být systém s některými vylepšeními. Vylepšení se zaměřují zejména na rychlejší segmentaci s minimální ztrátou přesnosti a co nejpřesnější clustering.  
Automatická identifikace klíčových slov
Mašláňová, Marcela ; Karafiát, Martin (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce si klade za cíl zpracovat poznatky o značkování klíčových slov v textu a využít je v praxi pro automatické generování rejstříků. Důvodem pro automatizaci tvorby rejstříků je jejich vysoká náročnost a cena. Teoretická část práce se zabývá především metodami hledání vícenásobných výrazů, které jsou významné pro zpracovávaný text. Praktická část aplikuje vybrané metody na testovací data a shrnuje výsledky experimentů.
Multi-Task Neural Networks for Speech Recognition
Egorova, Ekaterina ; Veselý, Karel (oponent) ; Karafiát, Martin (vedoucí práce)
The first part of this Master's thesis covers theoretical investigation into the principles and usage of neural networks, including their usability for the speech recognition tasks. Then it proceeds to summarize the multi-task neural networks' operating principles and some recent experiments with them. The practical part of the semester project reports changes made to a tool for neural network training which support multi-task training. Then the preparation of the settings is described, including a number of scripts written especially for this purpose. The experiments presented in the thesis explore the idea of using articulatory characteristics of phonemes as secondary tasks for multi-task training. The experiments are conducted on two different datasets of different quality and size and representing different languages - English and Vietnamese. Articulatory characteristics are occasionally combined with different secondary tasks, such as context, to see how well they function together. A comparison is made between the networks of different sizes to see how their size affects the effectiveness of multi-task training. These experiments show that multi-task training with the use of articulatory characteristics as secondary tasks can enhance training and yield better phoneme accuracy as a result. Finally, multi-task training is embedded to a speech recognition system as a feature extractor.
Rozpoznávání řeči pro vybrané jazyky
Schmitt, Jan ; Karafiát, Martin (oponent) ; Janda, Miloš (vedoucí práce)
Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.
Voice Activity Detection
Ent, Petr ; Karafiát, Martin (oponent) ; Matějka, Pavel (vedoucí práce)
This thesis deals with usage Support Vector Machines (SVM) for Speech Activity Detection (SAD). The first part of the thesis deals with comparison of different feature extractions and different methods of construction supervectors for classifying speech using SVM. The second part presents SVM based SAD system. All experiments were performed on ERT broadcast new database. Final comparison with two other approaches (phoneme and GMM based) was done on standard NIST 2006 Rich Test Evaluation database.
Adaptace rozpoznávače řeči na datech bez přepisu
Švec, Ján ; Karafiát, Martin (oponent) ; Schwarz, Petr (vedoucí práce)
Cílem práce je vytvořit a otestovat techniky pro adaptaci rozpoznávače řeči na audionahrávkach bez slovního přepisu. Nejprve připravíme data pro trenovaní rozpoznavače řeči a natrénujeme počáteční systém. Tímto rozpoznavačem přepišeme neznáma data a zaměříme se na experimentování s výběrem kvalitních adaptačních dat na základě míry kvality přepisu. Systém na nově vytvořené sadě přetrénujeme a vyhodnotíme úspešnost. Dále experimentujeme s množstvím adaptačních dat.

Národní úložiště šedé literatury : Nalezeno 38 záznamů.   začátekpředchozí29 - 38  přejít na záznam:
Viz též: podobná jména autorů
3 Karafiát, Michal
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.