Národní úložiště šedé literatury Nalezeno 10 záznamů.  Hledání trvalo 0.01 vteřin. 
Semi-Supervised Training of Deep Neural Networks for Speech Recognition
Veselý, Karel ; Ircing, Pavel (oponent) ; Lamel, Lori (oponent) ; Burget, Lukáš (vedoucí práce)
In this thesis, we first present the theory of neural network training for the speech recognition, along with our implementation, that is available as the 'nnet1' training recipe in the Kaldi toolkit. The recipe contains RBM pre-training, mini-batch frame Cross-Entropy training and sequence-discriminative sMBR training. Then we continue with the main topic of this thesis: semi-supervised training of DNN-based ASR systems. Inspired by the literature survey and our initial experiments, we investigated several problems: First, whether the confidences are better to be calculated per-sentence, per-word or per-frame. Second, whether the confidences should be used for data-selection or data-weighting. Both approaches are compatible with the framework of weighted mini-batch SGD training. Then we tried to get better insight into confidence calibration, more precisely whether it can improve the efficiency of semi-supervised training. We also investigated how the model should be re-tuned with the correctly transcribed data. Finally, we proposed a simple recipe that avoids a grid search of hyper-parameters, and therefore is very practical for general use with any dataset. The experiments were conducted on several data-sets: for Babel Vietnamese with 10 hours of transcribed speech, the Word Error Rate (WER) was reduced by 2.5%. For Switchboard English with 14 hours of transcribed speech, the WER was reduced by 3.2%. Although we found it difficult to further improve the performance of semi-supervised training by means of enhancing the confidences, we still believe that our findings are of significant practical value: the untranscribed data are abundant and easy to obtain, and our proposed solution brings solid WER improvements and it is not difficult to replicate.
Machine Translation Using Syntactic Analysis
Popel, Martin ; Žabokrtský, Zdeněk (vedoucí práce) ; Ircing, Pavel (oponent) ; Čmejrek, Martin (oponent)
Strojový překlad s využitím syntaktické analýzy Martin Popel Tato práce popisuje zlepšení anglicko-českého a česko-anglického strojo- vého překladu pomocí metod, které lze použít i na další jazyky. V první části je popsáno několik zlepšení hloubkově-syntaktického překladače TectoMT, například rozšíření pro další jazyky a domény nebo implementace nového typu překladových modelů využívajících kontext a různé metody strojového učení. V druhé části je popsán neuronový překladač Transformer a jeho vy- lepšení. Po detailní analýze vlivu různých hyperparametrů, bylo optimali- zováno trénování systému tak, že dosáhl o 1.0 BLEU lepšího překladu než nejlepší systém v soutěži WMT2017. Využitím jednojazyčných dat cílového jazyka pomocí nového typu zpětného překladu bylo dosaženo dalšího zlep- šení kvality překladu o 2.8 BLEU. Využitím doménové adaptace zohledňující "překladštinu" (translationese) - tedy zohledněním toho, zda paralelní data jsou původně psána česky, nebo anglicky - byl výsledný systém vylepšen o dalších 0.2 BLEU. Tento výsledný neuronový překladač byl signifikantně lepší (p<0.05) než všechny ostatní anglicko-české a česko-anglické překladače v soutěži WMT2018. Podle výsledků ručního hodnocení byla kvalita tohoto strojového překladu dokonce vyšší než kvalita lidského referenčního překladu.
Novel Methods for Natural Language Generation in Spoken Dialogue Systems
Dušek, Ondřej ; Jurčíček, Filip (vedoucí práce) ; Ircing, Pavel (oponent) ; Žabokrtský, Zdeněk (oponent)
Název práce: Nové metody generování promluv v dialogových systémech Autor: Ondřej Dušek Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Mgr. Filip Jurčíček, Ph.D., Ústav formální a aplikované lingvistiky Abstrakt: Tato disertační zkoumá nové přístupy ke generování přirozeného jazyka (NLG) v hlasových dialogových systémech, tj. generování odpovědí systému pro uživa- tele. Zaměřuje se přitom na zlepšení adaptivity NLG ve třech ohledech: přeno- sitelnost mezi různými doménami, přenositelnost mezi jazyky a přizpůsobení výstupu uživateli. Ve všech ohledech dosahují naše generátory zlepšení oproti dřívějším pří- stupům: 1) Naše generátory, založené na statistických metodách (prohledávání A* s perceptronovým rerankerem a architektuře rekurentních neuronových sítí sequence-to-sequence), lze natrénovat na datech bez podrobného sémantic- kého zarovnání slov na atributy vstupní reprezentace, což dovoluje jednodušší přetrénování pro nové domény než předchozí přístupy. 2) Generátor založený na neuronových sítích dále rozšiřujeme tak, že při generování bere v potaz kontext dosavadního dialogu (tj. i uživatelův způsob vyjadřování) a vytváří tak výstup přizpůsobený uživateli. 3) Vyhodnocujeme také několik úprav systému založeného na neuronových sítích, které jsou zaměřeny na generování výstupu v...
Information retrieval and navigation in audio-visual archives
Galuščáková, Petra ; Pecina, Pavel (vedoucí práce) ; Jones, Gareth (oponent) ; Ircing, Pavel (oponent)
Práca poskytuje prehľad metód pre interaktívne vyhľadávanie relevantných segmentov vo zvukových nahrávkach a vo videách. Práca najprv popisuje metódy pre vyhľadávanie v audio- vizuálnych archívoch založené na textovej informácii, ktoré využívajú automatické prepisy, titulky a metadáta. Kvalita vyhľadávania je skúmaná v závislosti na metódach segmentácie videa. Ďalej sú skúmané metódy pre navigáciu v multimédiách založené na multimodálnych hyperlinkoch a metódy pre automatický výber informatívnych segmentov videa, na ktoré je ďalej hyperlinking aplikovaný. Popísané metódy textového vyhľadávania, hyperlinkigu a výberu zaujímavých segmentov sú nakoniec použité v grafickom používateľskom rozhraní.
Semi-Supervised Training of Deep Neural Networks for Speech Recognition
Veselý, Karel ; Ircing, Pavel (oponent) ; Lamel, Lori (oponent) ; Burget, Lukáš (vedoucí práce)
In this thesis, we first present the theory of neural network training for the speech recognition, along with our implementation, that is available as the 'nnet1' training recipe in the Kaldi toolkit. The recipe contains RBM pre-training, mini-batch frame Cross-Entropy training and sequence-discriminative sMBR training. Then we continue with the main topic of this thesis: semi-supervised training of DNN-based ASR systems. Inspired by the literature survey and our initial experiments, we investigated several problems: First, whether the confidences are better to be calculated per-sentence, per-word or per-frame. Second, whether the confidences should be used for data-selection or data-weighting. Both approaches are compatible with the framework of weighted mini-batch SGD training. Then we tried to get better insight into confidence calibration, more precisely whether it can improve the efficiency of semi-supervised training. We also investigated how the model should be re-tuned with the correctly transcribed data. Finally, we proposed a simple recipe that avoids a grid search of hyper-parameters, and therefore is very practical for general use with any dataset. The experiments were conducted on several data-sets: for Babel Vietnamese with 10 hours of transcribed speech, the Word Error Rate (WER) was reduced by 2.5%. For Switchboard English with 14 hours of transcribed speech, the WER was reduced by 3.2%. Although we found it difficult to further improve the performance of semi-supervised training by means of enhancing the confidences, we still believe that our findings are of significant practical value: the untranscribed data are abundant and easy to obtain, and our proposed solution brings solid WER improvements and it is not difficult to replicate.
Machine Translation Using Syntactic Analysis
Popel, Martin ; Žabokrtský, Zdeněk (vedoucí práce) ; Ircing, Pavel (oponent) ; Čmejrek, Martin (oponent)
Strojový překlad s využitím syntaktické analýzy Martin Popel Tato práce popisuje zlepšení anglicko-českého a česko-anglického strojo- vého překladu pomocí metod, které lze použít i na další jazyky. V první části je popsáno několik zlepšení hloubkově-syntaktického překladače TectoMT, například rozšíření pro další jazyky a domény nebo implementace nového typu překladových modelů využívajících kontext a různé metody strojového učení. V druhé části je popsán neuronový překladač Transformer a jeho vy- lepšení. Po detailní analýze vlivu různých hyperparametrů, bylo optimali- zováno trénování systému tak, že dosáhl o 1.0 BLEU lepšího překladu než nejlepší systém v soutěži WMT2017. Využitím jednojazyčných dat cílového jazyka pomocí nového typu zpětného překladu bylo dosaženo dalšího zlep- šení kvality překladu o 2.8 BLEU. Využitím doménové adaptace zohledňující "překladštinu" (translationese) - tedy zohledněním toho, zda paralelní data jsou původně psána česky, nebo anglicky - byl výsledný systém vylepšen o dalších 0.2 BLEU. Tento výsledný neuronový překladač byl signifikantně lepší (p<0.05) než všechny ostatní anglicko-české a česko-anglické překladače v soutěži WMT2018. Podle výsledků ručního hodnocení byla kvalita tohoto strojového překladu dokonce vyšší než kvalita lidského referenčního překladu.
Information retrieval and navigation in audio-visual archives
Galuščáková, Petra ; Pecina, Pavel (vedoucí práce) ; Jones, Gareth (oponent) ; Ircing, Pavel (oponent)
Práca poskytuje prehľad metód pre interaktívne vyhľadávanie relevantných segmentov vo zvukových nahrávkach a vo videách. Práca najprv popisuje metódy pre vyhľadávanie v audio- vizuálnych archívoch založené na textovej informácii, ktoré využívajú automatické prepisy, titulky a metadáta. Kvalita vyhľadávania je skúmaná v závislosti na metódach segmentácie videa. Ďalej sú skúmané metódy pre navigáciu v multimédiách založené na multimodálnych hyperlinkoch a metódy pre automatický výber informatívnych segmentov videa, na ktoré je ďalej hyperlinking aplikovaný. Popísané metódy textového vyhľadávania, hyperlinkigu a výberu zaujímavých segmentov sú nakoniec použité v grafickom používateľskom rozhraní.
Novel Methods for Natural Language Generation in Spoken Dialogue Systems
Dušek, Ondřej ; Jurčíček, Filip (vedoucí práce) ; Ircing, Pavel (oponent) ; Žabokrtský, Zdeněk (oponent)
Název práce: Nové metody generování promluv v dialogových systémech Autor: Ondřej Dušek Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Mgr. Filip Jurčíček, Ph.D., Ústav formální a aplikované lingvistiky Abstrakt: Tato disertační zkoumá nové přístupy ke generování přirozeného jazyka (NLG) v hlasových dialogových systémech, tj. generování odpovědí systému pro uživa- tele. Zaměřuje se přitom na zlepšení adaptivity NLG ve třech ohledech: přeno- sitelnost mezi různými doménami, přenositelnost mezi jazyky a přizpůsobení výstupu uživateli. Ve všech ohledech dosahují naše generátory zlepšení oproti dřívějším pří- stupům: 1) Naše generátory, založené na statistických metodách (prohledávání A* s perceptronovým rerankerem a architektuře rekurentních neuronových sítí sequence-to-sequence), lze natrénovat na datech bez podrobného sémantic- kého zarovnání slov na atributy vstupní reprezentace, což dovoluje jednodušší přetrénování pro nové domény než předchozí přístupy. 2) Generátor založený na neuronových sítích dále rozšiřujeme tak, že při generování bere v potaz kontext dosavadního dialogu (tj. i uživatelův způsob vyjadřování) a vytváří tak výstup přizpůsobený uživateli. 3) Vyhodnocujeme také několik úprav systému založeného na neuronových sítích, které jsou zaměřeny na generování výstupu v...
Hledání spojitosti - použití kvantitativní textové analýzy ke zhodnocení vlivu textu na výsledky grantových programů
Valeš, Miroslav ; Bruckner, Tomáš (vedoucí práce) ; Ircing, Pavel (oponent)
V době, kdy je dobře dostupné softwarové a hardwarové vybavení pro automatizovanou analýzu textu a kdy jsou zároveň zpřístupněna obsáhlá data popisující reálné projekty přihlášené do grantových programů, je možno následovat fenomény z oblastí behaviorální ekonomie a psycholingvistky, které ukazují, že specifičnosti v textovém projevu mohou mít statisticky asociovatelný vztah s rozhodnutím čtenáře, v tomto případě tedy i vliv na závěrečné rozhodnutí o přidělení grantu. Práce vychází ze zmíněných oblastí a i za pomoci kvantitativních indikátorů používaných ve forenzní lingvistice provádí počítačem podpořenou kvantitativní analýzu textu, přičemž hlavním záměrem je z pohledu korelace vyhodnotit, zdali se v reálných operačních programech vyskytovaly asociovatelné závislosti mezi kvantitativními vlastnostmi textového popisu přihlášeného projektu a výší přiděleného nebo nepřiděleného grantu. Práce je rozčleněna do čtyř kapitol, kde zmiňuje východiska, popisuje zkoumaná data a metody, rozebírá provedené analýzy a nalezené závislosti, a v poslední kapitole sumarizuje a zhodnocuje odvedený výzkum.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.