Národní úložiště šedé literatury Nalezeno 9 záznamů.  Hledání trvalo 0.00 vteřin. 
Semi-Supervised Speech-to-Text Recognition with Text-to-Speech Critic
Baskar, Murali Karthick ; Manohar, Vimal (oponent) ; Trmal, Jan (oponent) ; Burget, Lukáš (vedoucí práce)
Sequence-to-sequence automatic speech recognition (ASR) models require large quantities of training data to attain good performance. For this reason, unsupervised and semi-supervised training in seq2seq models have recently witnessed a surge in interest. This work builds upon recent results showing notable improvements in semi-supervised training using cycle-consistency and related techniques. Such techniques derive training procedures and losses able to leverage unpaired speech and/or text data by combining ASR with text-to-speech (TTS) models. This thesis first proposes a new semi-supervised modelling framework combining an end-to-end differentiable ASR->TTS loss with TTS->ASR loss. The method is able to leverage unpaired speech and text data to outperform recently proposed related techniques in terms of word error rate (WER). We provide extensive results analysing the impact of data quantity as well as the contribution of speech and text modalities in recovering errors and show consistent gains across WSJ and LibriSpeech corpora. The thesis also discusses the limitations of the ASR<->TTS model in out-of-domain data conditions. We propose an enhanced ASR<->TTS (EAT) model incorporating two main features: 1) the ASR->TTS pipeline is equipped with a language model reward to penalize the ASR hypotheses before forwarding them to TTS; and 2) speech regularizer trained in unsupervised fashion is introduced in TTS->ASR to correct the synthesized speech before sending it to the ASR model. Training strategies and the effectiveness of the EAT model are explored and compared with augmentation approaches. The results show that EAT reduces the performance gap between supervised and semi-supervised training by absolute WER improvement of 2.6% and 2.7% on LibriSpeech and BABEL respectively.
Neural Network Training Progress Visualization
Němcová, Silvie ; Baskar, Murali Karthick (oponent) ; Beneš, Karel (vedoucí práce)
This work studies a neural network model during its training. The aim of this thesis is to visualize the training of the model and to examine the training. To achieve this goal I choose to implement a set of tools in Python language. The implementation successfully reproduces the linear path experiment, the identification of robust and ambient layers and the visualization of the loss surface. In addition the quadratic path experiment is presented in this thesis as novel method for analyzing the neural network training progress visualization.
Umělá inteligence pro deskovou hru
Tureček, Dominik ; Baskar, Murali Karthick (oponent) ; Beneš, Karel (vedoucí práce)
Tato práce navrhuje hráče ovládané umělou inteligencí pro hru Dice Wars. Dice Wars je nedeterministická tahová hra s nulovým součtem. Bylo vytvořeno několik AI hráčů s využitím pravidlového přístupu, algoritmu expecitminimax a logistické regrese. Pro zhodnocení kvality navržených AI hráčů byla vytvořena implementace hry Dice Wars. Z výsledků experimentů vyplývá, že ve hře dvou hráčů je výhodnější hrát agresivněji než v případě vícehráčových her. Ve hře osmi hráčů vyhrává AI využívající expectiminimax přes 60 % her proti náhodným hráčům a 21.4 % her proti ostatním navrženým AI. Ve hrách dvou hráčů dosahuje nejlepších výsledků AI založená na logistické regresi, která jako příznaky používá skóre a počty kostek jednotlivých hráčů. V průměru vyhrává 59.4 % her.
Implementace neuronové sítě bez operace násobení
Slouka, Lukáš ; Baskar, Murali Karthick (oponent) ; Szőke, Igor (vedoucí práce)
Predmetom tejto diplomovej práce je akcelerácia neurónových sietí s cieľom redukcie počtu operácií násobenia reálnych čísiel. Teoretická časť tejto práce sleduje súčasné trendy a metódy využívané v oblasti akcelerácie neurónových sietí. Najväčší dôraz je kladený na binarizačné techniky, ktoré umožňujú nahradiť násobenia logickými operátormi. Teoretický základ je zavedený do praxe hneď dvomi spôsobmi. Prvým z nich je implementácia kritických binárnych operátorov spustiteľných na GPU vo frameworku TensorFlow a ich rýchlostný benchmark. Druhým je aplikácia týchto operátorov v jednoduchom klasifikátore obrázkov. Výsledky sú rozhodne povzbudivé. Implementované operátory dosiahli 2,5-násobné zrýchlenie v porovnaní s vysoko optimalizovanými cuBLAS operátormi. Posledná kapitola práce sleduje úspešnosť dosiahnutú binarizačnými modelmi.
Synchronizace textu a audia
Šíma, Tomáš ; Baskar, Murali Karthick (oponent) ; Szőke, Igor (vedoucí práce)
Účelem této práce je průzkum exitujících algoritmů pro synchronizaci textu a audia. Vybrali jsme exitující implementaci jednoho z těchto algoritmů, který je založený na skrytých markovových modelech sdružených sekvencí a prozkoumaly jsme jeho výhody, nevýhody a podivnosti. Dále jsme ověřili, zda je možné předvídat úspěšnost zarovnání z hodnot generovaných Viterbi algoritmem a hodnotou paprsku. Naše testovací data pochází od BBC a byla součástí MGB Challenge 2015. Díky svojí různorodosti poskytují tato data ideální testovací set k ověření flexibility našeho algoritmu a jakožto i jeho schopnosti tolerovat chyby.
Neural Network Training Progress Visualization
Němcová, Silvie ; Baskar, Murali Karthick (oponent) ; Beneš, Karel (vedoucí práce)
This work studies a neural network model during its training. The aim of this thesis is to visualize the training of the model and to examine the training. To achieve this goal I choose to implement a set of tools in Python language. The implementation successfully reproduces the linear path experiment, the identification of robust and ambient layers and the visualization of the loss surface. In addition the quadratic path experiment is presented in this thesis as novel method for analyzing the neural network training progress visualization.
Umělá inteligence pro deskovou hru
Tureček, Dominik ; Baskar, Murali Karthick (oponent) ; Beneš, Karel (vedoucí práce)
Tato práce navrhuje hráče ovládané umělou inteligencí pro hru Dice Wars. Dice Wars je nedeterministická tahová hra s nulovým součtem. Bylo vytvořeno několik AI hráčů s využitím pravidlového přístupu, algoritmu expecitminimax a logistické regrese. Pro zhodnocení kvality navržených AI hráčů byla vytvořena implementace hry Dice Wars. Z výsledků experimentů vyplývá, že ve hře dvou hráčů je výhodnější hrát agresivněji než v případě vícehráčových her. Ve hře osmi hráčů vyhrává AI využívající expectiminimax přes 60 % her proti náhodným hráčům a 21.4 % her proti ostatním navrženým AI. Ve hrách dvou hráčů dosahuje nejlepších výsledků AI založená na logistické regresi, která jako příznaky používá skóre a počty kostek jednotlivých hráčů. V průměru vyhrává 59.4 % her.
Synchronizace textu a audia
Šíma, Tomáš ; Baskar, Murali Karthick (oponent) ; Szőke, Igor (vedoucí práce)
Účelem této práce je průzkum exitujících algoritmů pro synchronizaci textu a audia. Vybrali jsme exitující implementaci jednoho z těchto algoritmů, který je založený na skrytých markovových modelech sdružených sekvencí a prozkoumaly jsme jeho výhody, nevýhody a podivnosti. Dále jsme ověřili, zda je možné předvídat úspěšnost zarovnání z hodnot generovaných Viterbi algoritmem a hodnotou paprsku. Naše testovací data pochází od BBC a byla součástí MGB Challenge 2015. Díky svojí různorodosti poskytují tato data ideální testovací set k ověření flexibility našeho algoritmu a jakožto i jeho schopnosti tolerovat chyby.
Implementace neuronové sítě bez operace násobení
Slouka, Lukáš ; Baskar, Murali Karthick (oponent) ; Szőke, Igor (vedoucí práce)
Predmetom tejto diplomovej práce je akcelerácia neurónových sietí s cieľom redukcie počtu operácií násobenia reálnych čísiel. Teoretická časť tejto práce sleduje súčasné trendy a metódy využívané v oblasti akcelerácie neurónových sietí. Najväčší dôraz je kladený na binarizačné techniky, ktoré umožňujú nahradiť násobenia logickými operátormi. Teoretický základ je zavedený do praxe hneď dvomi spôsobmi. Prvým z nich je implementácia kritických binárnych operátorov spustiteľných na GPU vo frameworku TensorFlow a ich rýchlostný benchmark. Druhým je aplikácia týchto operátorov v jednoduchom klasifikátore obrázkov. Výsledky sú rozhodne povzbudivé. Implementované operátory dosiahli 2,5-násobné zrýchlenie v porovnaní s vysoko optimalizovanými cuBLAS operátormi. Posledná kapitola práce sleduje úspešnosť dosiahnutú binarizačnými modelmi.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.