Národní úložiště šedé literatury Nalezeno 6 záznamů.  Hledání trvalo 0.00 vteřin. 
New Methods in Statistical Speech Recognition
Klusáček, David ; Hajič, Jan (vedoucí práce) ; Psutka, Josef (oponent) ; Černocký, Jan (oponent)
Název Práce: Nové metody ve statistickém rozpoznávání řeči Autor: David Klusáček Katedra: Ústav formální a aplikované lingvistiky, MFF UK Školitel: Prof. RNDr. Jan Hajič, Dr., ÚFAL. Abstrakt: Tato práce se pokouší identifikovat limity současných rozpoznávačů řeči a navrhnout metody jak jejich omezení překonat. Po historickém úvodu a popisu současného stavu je jako nejslabší článek řetězu prohlášen akustický front-end, zejména jeho činnost za zhoršených zvukových podmínek. Navrho- vané řešení, tzv. NUFIBA front-end, zahrnuje kompenzaci ozvěny, segmentaci zvuku na řečníka a pozadí, a průběžné sledování SNR, které v součinnosti s akustickým modelem zabraňuje lavinovému šíření chyb. Z důvodu nedostatku času jiz bohužel nedošlo k implementaci celého rozpoznávače řeči (i když ně- které části byly značně rozpracovány, například jazykový model založený na MMI třídách). Nové myšlenky tak byly vyzkoušeny pouze v jednodušším roz- poznávači fonémů. Klíčová slova: Automatické rozpoznávání řeči, souvislá řeč, NUFIBA front- end, Jazykový model, Sluchová dráha, MMI, Shlukování, Slepá dekonvoluce, Časové a frekvenční maskování, Potlačení ozvěny, Rozpoznávání fonémů.
Speech Recognition of Czech Using Finite-State Machines
Podveský, Petr ; Hajič, Jan (vedoucí práce) ; Psutka, Josef (oponent) ; Krbec, Pavel (oponent)
Speech recognition has become a thriving field with many real-life applications. Voice dialing in cell phones, voice control in embedded devices, speech-driven interactive manuals and many other utilities rely on solid speech recognition software. We believe that research in speech recognition can boost performance of many applications related to the area. The thesis concentrates on automatic large-vocabulary continuous-speech recognition of Czech. Czech differs from English in a few aspects. We focus on these differences and propose new language-depended techniques. Namely rich morphology is investigated and its impact on speech recognition is studied. Out-of-vocabulary (OOV) words are identified as one of the major sources deteriorating recognition performace. New language modeling techniques are proposed to alleviate the problem of OOV words. The proposed language models are tested in speech recognition systems on diverse speech corpora. The obtained results validate the original approach to language modeling. Significant overall speech recognition improvement is observed.
Goal Oriented and Open Domain Dialogue Management
Vodolán, Miroslav ; Jurčíček, Filip (vedoucí práce) ; Psutka, Josef (oponent) ; Šedivý, Jan (oponent)
Název práce: Goal oriented a open domain řízení dialogu Autor: Miroslav Vodolán Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Mgr. Filip Jurčíček, Ph.D., Ústav formální a aplikované lingvistiky Abstrakt: Tato disertační práce navrhuje nové přístupy k řízení dialogu v dialogových sys- témech. Zaměřuje se na dialogové systémy pracující s omezeným počtem domén (goal oriented dialogue) a systémy pracující v otevřených doménách (open do- main dialogue). V obou případech se snaží zlepšit kvalitu dialogů mezi systémem a jeho uživateli: 1) U goal oriented dialogů vylepšujeme přesnost metod pro odhadování cíle uživatele v hlasových dialogových systémech. Náš přístup omezuje vliv chyb vzniklých při automatickém rozpoznávání řeči (ASR). Využíváme komplexní neu- ronové sítě, které inkrementálně zdokonalují snadno interpretovatelné pravidlové jádro. Vytvořený systém dosahuje několika publikovaných state-of-the-art vý- sledků na veřejných datasetech. 2) Efektivní řízení dialogu v otevřených doménách je náročným problémem, který zdůrazňuje, jak složité je strojové porozumnění přirozenému jazyku. V této práci nabízíme principiální přístupy k vývoji systémů, které pracují s otevřenými doménami. Klíčovou myšlenkou našeho přístupu je využití interaktivního učení dialogového systému z konverzací s...
New Methods in Statistical Speech Recognition
Klusáček, David ; Hajič, Jan (vedoucí práce) ; Psutka, Josef (oponent) ; Černocký, Jan (oponent)
Název Práce: Nové metody ve statistickém rozpoznávání řeči Autor: David Klusáček Katedra: Ústav formální a aplikované lingvistiky, MFF UK Školitel: Prof. RNDr. Jan Hajič, Dr., ÚFAL. Abstrakt: Tato práce se pokouší identifikovat limity současných rozpoznávačů řeči a navrhnout metody jak jejich omezení překonat. Po historickém úvodu a popisu současného stavu je jako nejslabší článek řetězu prohlášen akustický front-end, zejména jeho činnost za zhoršených zvukových podmínek. Navrho- vané řešení, tzv. NUFIBA front-end, zahrnuje kompenzaci ozvěny, segmentaci zvuku na řečníka a pozadí, a průběžné sledování SNR, které v součinnosti s akustickým modelem zabraňuje lavinovému šíření chyb. Z důvodu nedostatku času jiz bohužel nedošlo k implementaci celého rozpoznávače řeči (i když ně- které části byly značně rozpracovány, například jazykový model založený na MMI třídách). Nové myšlenky tak byly vyzkoušeny pouze v jednodušším roz- poznávači fonémů. Klíčová slova: Automatické rozpoznávání řeči, souvislá řeč, NUFIBA front- end, Jazykový model, Sluchová dráha, MMI, Shlukování, Slepá dekonvoluce, Časové a frekvenční maskování, Potlačení ozvěny, Rozpoznávání fonémů.
Tools and Data for Analysis of Spoken Czech and its Prosody
Peterek, Nino ; Hajičová, Eva (vedoucí práce) ; Kopeček, Ivan (oponent) ; Psutka, Josef (oponent)
Předkládaná práce popisuje naše kroky směřující k modelování prosodie češtiny. Po charakteristice a rozboru současných prosodických teorií a aplikací představujeme ústřední bod této práce, vývoj snadno přístupného a uživatelsky přívětivého výzkumného prostředí Dialogy.Org, které podporuje zkoumání české prosodie, její analýzu i modelování. Powered by TCPDF (www.tcpdf.org)
Speech Recognition of Czech Using Finite-State Machines
Podveský, Petr ; Hajič, Jan (vedoucí práce) ; Psutka, Josef (oponent) ; Krbec, Pavel (oponent)
Speech recognition has become a thriving field with many real-life applications. Voice dialing in cell phones, voice control in embedded devices, speech-driven interactive manuals and many other utilities rely on solid speech recognition software. We believe that research in speech recognition can boost performance of many applications related to the area. The thesis concentrates on automatic large-vocabulary continuous-speech recognition of Czech. Czech differs from English in a few aspects. We focus on these differences and propose new language-depended techniques. Namely rich morphology is investigated and its impact on speech recognition is studied. Out-of-vocabulary (OOV) words are identified as one of the major sources deteriorating recognition performace. New language modeling techniques are proposed to alleviate the problem of OOV words. The proposed language models are tested in speech recognition systems on diverse speech corpora. The obtained results validate the original approach to language modeling. Significant overall speech recognition improvement is observed.

Viz též: podobná jména autorů
2 PSUTKA, Jan
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.