Národní úložiště šedé literatury Nalezeno 12 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Automatická detekce jazyka textového dokumentu
Cakl, Jan ; Pešán, Jan (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce se zabývá rozpoznáním jazyka textového dokumentu. Výsledný program obsahuje implementaci dvou odlišných metod určených pro rozpoznání jazyka textu. První metoda je založena na frekvenčních statistikách N-gramu. Druhou metodou jsou Markovské řetězce a poslední metoda za účelem rozpoznání jazyka využívá umělou neuronovou síť. Řešení je implementováno v jazyce Python.
Detekce změny jazyka při hovoru
Povolný, Filip ; Glembek, Ondřej (oponent) ; Matějka, Pavel (vedoucí práce)
Tato práce se zabývá problematikou detekce změny jazyka při hovoru. V první části jsou popsány v současnosti používané metody diarizace jazyků. K implementaci byla vybrána metoda založená na akustickém přístupu identifikace jazyka s využitím směsi Gaussovských rozložení, i-vektoru a lineární diskriminační analýzy. Pro experimenty byla vytvořena mandarínsko-anglická databáze se střídáním jazyků. Na této databázi zvolený systém dosahuje úspěšnosti 89,3 % správně klasifikovaných segmentů.
Multimediální prohlížeč pro přednášky
Kubalík, Jakub ; Potúček, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
V úvodní části čtenář pochopí význam toho projektu a proč vlastně vznikl. Jedná se o rozsáhlejší týmový projekt, proto popis jeho struktury představuje významnou část práce. Jádro prohlížeče zahrnuje řadu technik, jako např. komponentový systém, speciální systém vnitřní komunikace a další. Vysoký důraz je kladen na přenositelnost a znovupoužitelnost systému - bylo nutné jasně specifikovat pravidla pro syntaxi a používané datové formáty. Nezaměnitelnou úlohu v projektu hraje formát XML. Poslední úpravy představovali především vývoj nových komponent, které současně počítají s budoucím využitím projektu a jeho zapojením do komplexního vyhledávacího systému - ten představuje závěrečná kapitola.
Intersession Variability Compensation in Language and Speaker Identification
Hubeika, Valiantsina ; Burget, Lukáš (oponent) ; Matějka, Pavel (vedoucí práce)
Varibiality in the channel and session is an important issue in the text-independent speaker recognition task. To date, several techniques providing channel and session variability compensation were introduced in a number of scientic papers. Such implementation can be done in feature, model and score domain. Relatively new and powerful approach to remove channel distortion is so-called eigenchannel adaptation for Gaussian Mixture Models (GMM). The drawback of the technique is that it is not applicable in its original implementation to different types of classifiers, eg. Support Vector Machines (SVM), GMM with different number of Gaussians or in speech recognition task using Hidden Markov Models (HMM). The solution can be the approximation of the technique, eigenchannel adaptation in feature domain. Both, the original eigenchannel adaptation and eigenchannel adaptation on features in task of speaker recognition are presented. After achieving good results in speaker recognition, contribution of the same techniques was examined in acoustic language identification system with $14$ languages. In this task undesired factors are channel and speaker variability. Presented results are presented on the NIST Speaker Recognition Evaluation 2006 data and NIST Language Recognition Evaluation 2007 data.
PHONOTACTIC AND ACOUSTIC LANGUAGE RECOGNITION
Matějka, Pavel ; Sigmund, Milan (vedoucí práce)
This thesis deals with phonotactic and acoustic techniques for automatic language recognition (LRE). The first part of the thesis deals with the phonotactic language recognition based on co-occurrences of phone sequences in speech. A thorough study of phone recognition as tokenization technique for LRE is done, with focus on the amounts of training data for phone recognizer and on the combination of phone recognizers trained on several language (Parallel Phone Recognition followed by Language Model - PPRLM). The thesis also deals with novel technique of anti-models in PPRLM and investigates into using phone lattices instead of strings. The work on phonotactic approach is concluded by a comparison of classical n-gram modeling techniques and binary decision trees. The acoustic LRE was addressed too, with the main focus on discriminative techniques for training target language acoustic models and on initial (but successful) experiments with removing channel dependencies. We have also investigated into the fusion of phonotactic and acoustic approaches. All experiments were performed on standard data from NIST 2003, 2005 and 2007 evaluations so that the results are directly comparable to other laboratories in the LRE community. With the above mentioned techniques, the fused systems defined the state-of-the-art in the LRE field and reached excellent results in NIST evaluations.
Vícejazykový fonémový rozpoznávač
Vobr, Vojtěch ; Matějka, Pavel (oponent) ; Szőke, Igor (vedoucí práce)
Cílem, této diplomové práce je natrénovat fonémový rozpoznávač s fonémovou sadou, která vznikla spojením fonémových sad jazyků obsažených v databázi SpeechDat-E a zjistit, zda takovýto rozpoznávač bude podávat lepší výsledky než rozpoznávače natrénované pouze pro jediný jazyk. Tato práce pojednává o fonémových sadách, principech rozpoznávání jednotlivých fonémů pomocí rozpoznávačů založených na neuronových sítích, dále o způsobech rozpoznávání a identifikace mluveného jazyka a také o spojování fonémových sad jednotlivých jazyků. Dále je zde popsán postup trénování fonémového rozpoznávače a rozpoznávání fonémů.
Automatická detekce jazyka textového dokumentu
Cakl, Jan ; Pešán, Jan (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce se zabývá rozpoznáním jazyka textového dokumentu. Výsledný program obsahuje implementaci dvou odlišných metod určených pro rozpoznání jazyka textu. První metoda je založena na frekvenčních statistikách N-gramu. Druhou metodou jsou Markovské řetězce a poslední metoda za účelem rozpoznání jazyka využívá umělou neuronovou síť. Řešení je implementováno v jazyce Python.
Multimediální prohlížeč pro přednášky
Kubalík, Jakub ; Potúček, Igor (oponent) ; Schwarz, Petr (vedoucí práce)
V úvodní části čtenář pochopí význam toho projektu a proč vlastně vznikl. Jedná se o rozsáhlejší týmový projekt, proto popis jeho struktury představuje významnou část práce. Jádro prohlížeče zahrnuje řadu technik, jako např. komponentový systém, speciální systém vnitřní komunikace a další. Vysoký důraz je kladen na přenositelnost a znovupoužitelnost systému - bylo nutné jasně specifikovat pravidla pro syntaxi a používané datové formáty. Nezaměnitelnou úlohu v projektu hraje formát XML. Poslední úpravy představovali především vývoj nových komponent, které současně počítají s budoucím využitím projektu a jeho zapojením do komplexního vyhledávacího systému - ten představuje závěrečná kapitola.
Vícejazykový fonémový rozpoznávač
Vobr, Vojtěch ; Matějka, Pavel (oponent) ; Szőke, Igor (vedoucí práce)
Cílem, této diplomové práce je natrénovat fonémový rozpoznávač s fonémovou sadou, která vznikla spojením fonémových sad jazyků obsažených v databázi SpeechDat-E a zjistit, zda takovýto rozpoznávač bude podávat lepší výsledky než rozpoznávače natrénované pouze pro jediný jazyk. Tato práce pojednává o fonémových sadách, principech rozpoznávání jednotlivých fonémů pomocí rozpoznávačů založených na neuronových sítích, dále o způsobech rozpoznávání a identifikace mluveného jazyka a také o spojování fonémových sad jednotlivých jazyků. Dále je zde popsán postup trénování fonémového rozpoznávače a rozpoznávání fonémů.
Intersession Variability Compensation in Language and Speaker Identification
Hubeika, Valiantsina ; Burget, Lukáš (oponent) ; Matějka, Pavel (vedoucí práce)
Varibiality in the channel and session is an important issue in the text-independent speaker recognition task. To date, several techniques providing channel and session variability compensation were introduced in a number of scientic papers. Such implementation can be done in feature, model and score domain. Relatively new and powerful approach to remove channel distortion is so-called eigenchannel adaptation for Gaussian Mixture Models (GMM). The drawback of the technique is that it is not applicable in its original implementation to different types of classifiers, eg. Support Vector Machines (SVM), GMM with different number of Gaussians or in speech recognition task using Hidden Markov Models (HMM). The solution can be the approximation of the technique, eigenchannel adaptation in feature domain. Both, the original eigenchannel adaptation and eigenchannel adaptation on features in task of speaker recognition are presented. After achieving good results in speaker recognition, contribution of the same techniques was examined in acoustic language identification system with $14$ languages. In this task undesired factors are channel and speaker variability. Presented results are presented on the NIST Speaker Recognition Evaluation 2006 data and NIST Language Recognition Evaluation 2007 data.

Národní úložiště šedé literatury : Nalezeno 12 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.