National Repository of Grey Literature 12 records found  1 - 10next  jump to record: Search took 0.00 seconds. 
Language Identification of Text Document
Cakl, Jan ; Pešán, Jan (referee) ; Szőke, Igor (advisor)
The thesis deals with a language identification of a text document. The final program includes three different implementation methods of language identification. The first method is based on a frequency statistics of N-gram. The second one represents Markov chains and the last one uses the simulated neural net for the identification purposes. The result is implemented in the Python language.
Code Switching Detection in Speech
Povolný, Filip ; Glembek, Ondřej (referee) ; Matějka, Pavel (advisor)
This master's thesis deals with code-switching detection in speech. The state-of-the-art methods of language diarization are described in the first part of the thesis. The proposed method for implementation is based on acoustic approach to language identification using combination of GMM, i-vector and LDA. New Mandarin-English code-switching database was created for these experiments. Using this system, accuracy of 89,3 % is achieved on this database.
Multimedia Browser for Lectures
Kubalík, Jakub ; Potúček, Igor (referee) ; Schwarz, Petr (advisor)
In preamble reader will understand the purpose of this project and why it was initiated. It's large team project, so description of its structure represents main part of this report. A core of the browser contain a lot of techniques, e.g. system of components, special internal communication and other. The main goals of this system are portability and reusability - there is exact specification of syntax rules and used data formats. Non-interchangeable role in project has format XML. Invention of new components was the last intervention in project, with intention to use of the project in future and involve in complex search engine - the engine discuss final part of report.
Intersession Variability Compensation in Language and Speaker Identification
Hubeika, Valiantsina ; Burget, Lukáš (referee) ; Matějka, Pavel (advisor)
Variabilita kanálu a hovoru je velmi důležitým problémem v úloze rozpoznávání mluvčího. V současné době je ve velkém množství vědeckých článků uvedeno několik technik pro kompenzaci vlivu kanálu. Kompenzace vlivu kanálu může být implementována jak v doméně modelu, tak i v doménách příznaků i skóre. Relativně nová výkoná technika je takzvaná eigenchannel adaptace pro GMM (Gaussian Mixture Models). Mevýhodou této metody je nemožnost její aplikace na jiné klasifikátory, jako napřílad takzvané SVM (Support Vector Machines), GMM s různým počtem Gausových komponent nebo v rozpoznávání řeči s použitím skrytých markovových modelů (HMM). Řešením může být aproximace této metody, eigenchannel adaptace v doméně příznaků. Obě tyto techniky, eigenchannel adaptace v doméně modelu a doméně příznaků v systémech rozpoznávání mluvčího, jsou uvedeny v této práci. Po dosažení dobrých výsledků v rozpoznávání mluvčího, byl přínos těchto technik zkoumán pro akustický systém rozpoznávání jazyka zahrnující 14 jazyků. V této úloze má nežádoucí vliv nejen variabilita kanálu, ale i variabilita mluvčího. Výsledky jsou prezentovány na datech definovaných pro evaluaci rozpoznávání mluvčího z roku 2006 a evaluaci rozpoznávání jazyka v roce 2007, obě organizované Amerických Národním Institutem pro Standard a Technologie (NIST)
PHONOTACTIC AND ACOUSTIC LANGUAGE RECOGNITION
Matějka, Pavel ; Sigmund, Milan (advisor)
Práce pojednává o fonotaktickém a akustickém přístupu pro automatické rozpoznávání jazyka. První část práce pojednává o fonotaktickém přístupu založeném na výskytu fonémových sekvenci v řeči. Nejdříve je prezentován popis vývoje fonémového rozpoznávače jako techniky pro přepis řeči do sekvence smysluplných symbolů. Hlavní důraz je kladen na dobré natrénování fonémového rozpoznávače a kombinaci výsledků z několika fonémových rozpoznávačů trénovaných na různých jazycích (Paralelní fonémové rozpoznávání následované jazykovými modely (PPRLM)). Práce také pojednává o nové technice anti-modely v PPRLM a studuje použití fonémových grafů místo nejlepšího přepisu. Na závěr práce jsou porovnány dva přístupy modelování výstupu fonémového rozpoznávače -- standardní n-gramové jazykové modely a binární rozhodovací stromy. Hlavní přínos v akustickém přístupu je diskriminativní modelování cílových modelů jazyků a první experimenty s kombinací diskriminativního trénování a na příznacích, kde byl odstraněn vliv kanálu. Práce dále zkoumá různé druhy technik fúzi akustického a fonotaktického přístupu. Všechny experimenty jsou provedeny na standardních datech z NIST evaluaci konané v letech 2003, 2005 a 2007, takže jsou přímo porovnatelné s výsledky ostatních skupin zabývajících se automatickým rozpoznáváním jazyka. S fúzí uvedených technik jsme posunuli state-of-the-art výsledky a dosáhli vynikajících výsledků ve dvou NIST evaluacích.
Multilingual Phoneme Recognizer
Vobr, Vojtěch ; Matějka, Pavel (referee) ; Szőke, Igor (advisor)
Aim, of this master thesis is training of phoneme recognizer with phoneme set, which have been made by merging of several phoneme sets, which are containted in SpeechDat-E database and find out if this kind of recognizer will have better results than recognizers which were trained on one language. This work also deals with phoneme sets, principles of phoneme recognition using recognizers based on artifical neural networks, language identification and merging of given phoneme sets. Also is described process of training phoneme recognizer and phoneme recognition.
Language Identification of Text Document
Cakl, Jan ; Pešán, Jan (referee) ; Szőke, Igor (advisor)
The thesis deals with a language identification of a text document. The final program includes three different implementation methods of language identification. The first method is based on a frequency statistics of N-gram. The second one represents Markov chains and the last one uses the simulated neural net for the identification purposes. The result is implemented in the Python language.
Multimedia Browser for Lectures
Kubalík, Jakub ; Potúček, Igor (referee) ; Schwarz, Petr (advisor)
In preamble reader will understand the purpose of this project and why it was initiated. It's large team project, so description of its structure represents main part of this report. A core of the browser contain a lot of techniques, e.g. system of components, special internal communication and other. The main goals of this system are portability and reusability - there is exact specification of syntax rules and used data formats. Non-interchangeable role in project has format XML. Invention of new components was the last intervention in project, with intention to use of the project in future and involve in complex search engine - the engine discuss final part of report.
Multilingual Phoneme Recognizer
Vobr, Vojtěch ; Matějka, Pavel (referee) ; Szőke, Igor (advisor)
Aim, of this master thesis is training of phoneme recognizer with phoneme set, which have been made by merging of several phoneme sets, which are containted in SpeechDat-E database and find out if this kind of recognizer will have better results than recognizers which were trained on one language. This work also deals with phoneme sets, principles of phoneme recognition using recognizers based on artifical neural networks, language identification and merging of given phoneme sets. Also is described process of training phoneme recognizer and phoneme recognition.
Intersession Variability Compensation in Language and Speaker Identification
Hubeika, Valiantsina ; Burget, Lukáš (referee) ; Matějka, Pavel (advisor)
Variabilita kanálu a hovoru je velmi důležitým problémem v úloze rozpoznávání mluvčího. V současné době je ve velkém množství vědeckých článků uvedeno několik technik pro kompenzaci vlivu kanálu. Kompenzace vlivu kanálu může být implementována jak v doméně modelu, tak i v doménách příznaků i skóre. Relativně nová výkoná technika je takzvaná eigenchannel adaptace pro GMM (Gaussian Mixture Models). Mevýhodou této metody je nemožnost její aplikace na jiné klasifikátory, jako napřílad takzvané SVM (Support Vector Machines), GMM s různým počtem Gausových komponent nebo v rozpoznávání řeči s použitím skrytých markovových modelů (HMM). Řešením může být aproximace této metody, eigenchannel adaptace v doméně příznaků. Obě tyto techniky, eigenchannel adaptace v doméně modelu a doméně příznaků v systémech rozpoznávání mluvčího, jsou uvedeny v této práci. Po dosažení dobrých výsledků v rozpoznávání mluvčího, byl přínos těchto technik zkoumán pro akustický systém rozpoznávání jazyka zahrnující 14 jazyků. V této úloze má nežádoucí vliv nejen variabilita kanálu, ale i variabilita mluvčího. Výsledky jsou prezentovány na datech definovaných pro evaluaci rozpoznávání mluvčího z roku 2006 a evaluaci rozpoznávání jazyka v roce 2007, obě organizované Amerických Národním Institutem pro Standard a Technologie (NIST)

National Repository of Grey Literature : 12 records found   1 - 10next  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.