keywords:"automatic speech recognition" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"automatic speech recognition"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Automatické hodnocení anglické výslovnosti nerodilých mluvčích Gazdík, Peter ; Szőke, Igor (oponent) ; Žmolíková, Kateřina (vedoucí práce) Výuka anglickej výslovnosti s využitím počítača sa v súčasnej dobe stáva čoraz viac populárnejšou. Napriek tomu presnosť týchto systémov je stále pomerne nízka. Táto diplomová práca sa preto zameriava na zlepšenie existujúcich metód automatického hodnotenia výslovnosti. V prvej časti práce je uvedený prehľad v súčasnosti používaných techník v tejto oblasti. Následne bol navrhnutý systém využívajúci dva rôzne prístupy. Dosiahnuté výsledky ukazujú znateľné zlepšenie oproti referenčnému systému. Úplný záznam
	Finite-state based recognition networks for forward-backward speech decoding Hannemann, Mirko ; AD, Ralf Schlüter, (oponent) ; Novák,, Miroslav (oponent) ; Burget, Lukáš (vedoucí práce) Many tasks can be formulated in the mathematical framework of weighted finite state transducers (WFST). This is also the case for automatic speech recognition (ASR). Nowadays, ASR makes extensive use of composed probabilistic models -- called decoding graphs or recognition networks. They are constructed from the individual components via WFST operations like composition. Each component is a probabilistic knowledge source that constrains the search for the best path through the composed graph -- called decoding. The usage of a coherent framework guarantees, that the resulting automata will be optimal in a well-defined sense. WFSTs can be optimized with the help of determinization and minimization in a given semi-ring. The application of these algorithms results in the optimal structure for search and the optimal distribution of weights is achieved by applying a weight pushing algorithm. The goal of this thesis is to further develop the recipes and algorithms for the construction of optimal recognition networks. We introduce an alternative weight pushing algorithm, that is suitable for an important class of models -- language model transducers, or more generally cyclic WFSTs and WFSTs with failure (back-off) transitions. We also present a recipe to construct recognition networks, which are suitable for decoding backwards in time, and which, at the same time, are guaranteed to give exactly the same probabilities as the forward recognition network. For that purpose, we develop an algorithm for exact reversal of back-off language models and their corresponding language model transducers. We apply these backward recognition networks in an optimization technique: In a static network decoder, we use it for a two-pass decoding setup (forward search and backward search). This approach is called tracked decoding and allows to incorporate the first pass decoding into the second pass decoding by tracking hypotheses from the first pass lattice. This technique results in significant speed-ups, since it allows to decode with a variable beam width, which is most of the time much smaller than the baseline beam. We also show that it is possible to apply the algorithms in a dynamic network decoder by using the incrementally refining recognition setup. This additionally leads to a partial parallelization of the decoding. Úplný záznam
	Neural networks for automatic speaker, language, and sex identification Do, Ngoc ; Jurčíček, Filip (vedoucí práce) ; Peterek, Nino (oponent) Název: Neuronové sítě pro automatické rozpoznávání řečníka, jazyka a pohlaví Autorka: Bich-Ngoc Do Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Mgr. Filip Jurek, Ph.D., Ústav formální a aplikované lingvistiky, a Dr. Marco Wiering, Institut umělé inteligence a kognitivních věd, Fakulta matematiky a přírodních věd, Univerzita v Groningenu Abstrakt: Rozpoznávání řečníka je náročný úkol a má využití v mnoha oblastech, například využítí pro autorizaci nebo forenzní vědě. V posledních letech se rozšířil koncept učení hlubokých, především hluboké neuronové sítě, které se ukázaly jako schopná technika strojového učení a dosáhly výborných úspěchů v mnoha oblastech výzkumu zpracování přirozeného jazyka a zpra- cování mluveného slova. Tato práce si dává za cíl prozkoumat možnosti modelu hlubokých neuronových sítí, rekurentních neuronových sítí v úloze rozpoznávání řečníka. Námi navržené systémy byly vyhodnoceny na kor- pusu TIMIT pro úlohu identifikace řečníka. V porovnání s jinými systémy za stejných testových podmínkách náš systém nedosáhl referenčních výsledků kvůli nedostatku validačních dat. Naše experimenty ukázaly, že nejlepší konfigurace systému je... Úplný záznam
	Development of a cloud platform for automatic speech recognition Klejch, Ondřej ; Jurčíček, Filip (vedoucí práce) ; Bojar, Ondřej (oponent) Tato diplomová práce představuje cloudovou platformu pro automatické rozpoznávání řeči, CloudASR, která je postavena na systému pro rozpoznávání řeči Kaldi. Platforma podporuje dávkový a online způsob rozpoznávání řeči a také obsahuje anotační prostředí pro přidávání přepisů k odeslaným nahrávkám. Mezi klíčové vlastnosti této platformy patří škálovatelnost, přizpůsobitelnost a jednoduchý proces nasazení. Provedená měření dokázala, že latence platformy je porovnatelná s latencí Google Speech API a přesnost přepisů na omezených doménách může být dokonce lepší. Dále bylo ukázáno, že je platforma schopná zpracovat více než 1000 paralelních dotazů, pokud má dostatek výpočetních zdrojů. 1 Úplný záznam
	Development of an English public transport information dialogue system Vejman, Martin ; Jurčíček, Filip (vedoucí práce) ; Peterek, Nino (oponent) Tato práce se zabývá vývojem anglického dialogového systému, který je založen na frameworku Alex určeném pro vytváření dialogových systémů. Práce popisuje adaptaci komponent frameworku na novou doménu a anglický jazyk. Výsledný dialogový systém poskytuje informace o veřejné dopravě ve městě New York. Součástí práce je příprava statistického modelu a nasazení vlastního rozpoznávače řeči pomocí nástrojů Kaldi. Bylo s ním ve srovnání s Google Speech API dosaženo lepších výsledků, které vychází ze subjektivního hodnocení uživatelů získaného pomocí crowdsourcingu. Powered by TCPDF (www.tcpdf.org) Úplný záznam
	Vývoj hlasově ovládaných webových her pomocí CloudASR Milota, Jan ; Jurčíček, Filip (vedoucí práce) ; Vidová Hladká, Barbora (oponent) Cílem práce je navrhnout a vyvinout software pro výuku jazyků hrou za použití webových technologií a čerstvě vznikající CloudASR knihovny. Běžný uživatel provozuje interakci se svým prohlížečem skoro výhradně prostřednictvím myši a klávesnice. Díky softwaru, který tato práce reprezentuje, má nyní uživatel příležitost zabřednout do někdy ne úplně populární výuky jazyka i za pomoci svého hlasu. Což nabízí zmíněné výuce netušené možnosti, obzvláště stran uživatelské interaktivity. Důraz byl kladen na uživatelskou přívětivost, grafickou fidelitu a na kompetitivní aspekt výuky, využívajíc Facebookovou integraci a bodové hodnotící žebříčky. Powered by TCPDF (www.tcpdf.org) Úplný záznam
	Finite State Grammars and Language Models for Automatic Speech Recognition Beneš, Karel ; Glembek, Ondřej (oponent) ; Hannemann, Mirko (vedoucí práce) This thesis deals with the transformation of Context Free Grammars (CFG) into Weighted Finite State Transducers (WFST). A subset of CFG is chosen, that can be transformed exactly. Both the test of whether a CFG fulfills such condition and the algorithm for the following transformation are presented. A tool has been implemented, which performs both these tasks, also its input and output processing are reported. Using this tool, a speech recognition system for aircraft cockpit control has been built. Results are presented which show, that the system based on the transformed grammar outperforms the system based on general-purpose language model. Úplný záznam
	Integrace hlasových technologií na mobilní platformy Černičko, Sergij ; Černocký, Jan (oponent) ; Schwarz, Petr (vedoucí práce) Cílem práce je seznámit se s metodami a technikami využívanými při zpracování řeči. Popsat současný stav výzkumu a vývoje řečových technologií. Navrhnout a implementovat serverový rozpoznávač řeči, který využívá BSAPI. Integrovat klienta, který bude využívat server pro rozpoznání řeči, do mobilních slovníků společnosti Lingea. Úplný záznam
	Srovnání úspěšnosti Siri, Cortany a Google Procingerová, Lucie ; Černocký, Jan (oponent) ; Szőke, Igor (vedoucí práce) Cílem této práce je porovnat úspěšnost překladu mluveného slova do textu s využitím několika služeb. Primárně se jedná o aplikace od společností Apple Inc., Microsoft Corporation a Google Inc., avšak je zde zahrnuto také několik dalších aplikací, dostupných převážně on-line. Tento dokument obsahuje popis zadaného problému, rozbor postupu provádění přepisu u jednotlivých služeb. Následně jsou rozebrány výsledky testu a porovnány s referenčními výstupy. Na závěr je uvedena diskuze těchto pokusů. Úplný záznam
	Zvyšování účinnosti strojového rozpoznávání řeči Zelinka, Petr ; Tučková,, Jana (oponent) ; Nouza,, Jan (oponent) ; Sigmund, Milan (vedoucí práce) V práci jsou identifikovány příčiny nedostatečné spolehlivosti současných systémů pro automatické rozpoznávání řeči při jejich nasazení v náročných podmínkách. U jednotlivých rušivých vlivů je popsán jejich dopad na úspěšnost rozpoznávání a je podán výčet známých postupů pro identifikaci těchto vlivů analýzou rozpoznávaného signálu. Je též uveden přehled obvyklých metod používaných k omezení dopadu rušivých vlivů na funkci rozpoznávače řeči. Vlastní přínos tkví v navržení nových postupů pro vytváření akustických modelů zašuměné řeči a modelů nestacionárního šumu, díky kterým je možné dosáhnout vysoké úspěšnosti rozpoznávání v náročných akustických podmínkách. Účinnost navržených opatření byla otestována na rozpoznávači izolovaných slov s využitím nahrávky reálného akustického pozadí operačního sálu pořízené na Uniklinikum Marburg v Německu při několikahodinové neurochirurgické operaci. Tato práce jako první přináší popis dopadu změn v hlasovém úsilí mluvčích na spolehlivost rozpoznávání řeči v celém rozsahu, tj. od šepotu až po křik. Je navržena koncepce rozpoznávače řeči, který je imunní vůči změnám v hlasovém úsilí mluvčích. Pro účely zkoumání změn v hlasovém úsilí byla v rámci řešení práce sestavena nová řečová databáze BUT-VE1. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English