keywords:"Speech Recognition" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"Speech Recognition"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Paralelní trénování neuronových sítí pro rozpoznávání řeči Veselý, Karel ; Fousek, Petr (oponent) ; Burget, Lukáš (vedoucí práce) Tato diplomová práce je zaměřena na paralelizaci trénování neuronových sítí pro rozpoznávání řeči. V rámci této diplomové práce byly implementovány a porovnány dvě strategie paralelizace. První strategií je paralelizace dat s využitím rozdělení trénování do několika POSIX vláken. Druhou strategií je paralelizace uzlů s využitím platformy pro obecné výpočty na grafických kartách CUDA. V případě první strategie bylo dosaženo 4x urychlení, v případě využití platformy CUDA bylo dosaženo téměř 10x urychlení. Pro trénování byl použit algoritmus Stochastic Gradient Descent se zpětným šířením chyb. Po krátkém úvodu následuje druhá kapitola práce, která je motivační a zasazuje probém do kontextu rozpoznávání řeči. Třetí kapitola práce je teoretická a diskutuje neuronové sítě a metodu trénování. Následující kapitoly jsou zaměřené na návrh a implementaci a popisují iterativní vývoj tohoto projektu. Poslední obsáhlá kapitola popisuje testovací systém a uvádí výsledky provedených experimentů. V závěru jsou krátce zhodnoceny dosažené výsledky a nastíněna perspektiva dalšího vývoje projektu. Úplný záznam
	Mining of Textual Data from the Web for Speech Recognition Kubalík, Jakub ; Plchot, Oldřich (oponent) ; Mikolov, Tomáš (vedoucí práce) The preliminary goals of this project were to get familiar with language modeling for speech recognition and techniques for acquisition of text data from the Web. Speech recognition techniques are introduced and statistical language modeling is described in detail. The text also covers mining models and techniques, information retrieval especially. Specific problems of Web mining are discussed and Google search is introduced. Special attention was paid to detailed description of implementation of the text mining system. However, the main goal of this work was to determine, whether the data acquired from the Web can provide some improvement into the recognition systems. The text is describing experiments, which use the retrieved Web data to update sample language models. Úplný záznam
	Optimalizace rozpoznávání řeči pro mobilní zařízení Tomec, Martin ; Zbořil, František (oponent) ; Hanáček, Petr (vedoucí práce) Práce se zabývá optimalizací algoritmů pro detekci klíčových slov na procesorové architektuře ARM Cortex-A8. Nejprve je popsána tato architektura a zejména její jednotka NEON pro vektorové výpočty. Dále jsou stručně popsány algoritmy pro detekci klíčových slov a navržena jejich optimalizace pro danou architekturu. Jádro práce tvoří implementace těchto optimalizací a zhodnocení jejich vlivu na výkon. Úplný záznam
	Modelování jazyka v rozpoznávání češtiny Mikolov, Tomáš ; Černocký, Jan (oponent) ; Smrž, Pavel (vedoucí práce) Tato práce se zabývá problematikou jazykových modelů v oblasti automatického přepisu mluvené řeči. V teoretické části jsou rozebrány současně používané metody pro pokročilé jazykové modelování založené na statistickém přístupu - modely založené na třídách, na faktorech a na neuronových sítích. Následně je popsána implementace jazykového modelu založeného na dvou neuronových sítích. V závěru práce jsou uvedeny výsledky dosažené na Pražském a Brněnském mluveném korpusu (cca 1 170 000 slov) - redukce perplexity o zhruba 20%. Výsledky dosažené při reskórování N-best listů ukazují zlepšení při rozpoznávání spontánní řeči o více než 1%. V závěru práce jsou uvedeny možnosti využití práce, její možná rozšíření a také jsou uvedeny hlavní nevýhody současně používaných přístupů pro statistické jazykové modelování. Úplný záznam
	Implementace detektoru klíčových slov do mobilního telefonu (Symbian 60) Cipr, Tomáš ; Schwarz, Petr (oponent) ; Szőke, Igor (vedoucí práce) Detektor klíčových slov je jednou z aplikací automatického rozpoznávání řeči. Úkolem detektoru je určit, ve kterých místech souvislého toku řeči se vyskytují slova ze zadaného seznamu. Detektor klíčových slov najde řadu uplatnění mimo jiné i v mobilních telefonech, např. pro jejich ovládání hlasem. S nástupem OS Symbian se otevřela možnost jak detektor implementovat i pro tato zařízení. Zpráva popisuje jednak teoretická a odborná východiska realizace detektoru a také jeho následnou implementaci. Nejdříve je uveden operační systém Symbian s ohledem na praktické řešení úkolu. Dále je popsán způsob detekce klíčových slov od vstupního řečového signálu až po výstup, zda a která slova byla nalezena. Následně je prezentován objektový návrh detektoru a podrobněji popsána jeho implementace. Závěrem jsou shrnuty dosažené výsledky a nastíněn další vývoj. Úplný záznam
	Integrace hlasových technologií na mobilní platformy Černičko, Sergij ; Černocký, Jan (oponent) ; Schwarz, Petr (vedoucí práce) Cílem práce je seznámit se s metodami a technikami využívanými při zpracování řeči. Popsat současný stav výzkumu a vývoje řečových technologií. Navrhnout a implementovat serverový rozpoznávač řeči, který využívá BSAPI. Integrovat klienta, který bude využívat server pro rozpoznání řeči, do mobilních slovníků společnosti Lingea. Úplný záznam
	Multi-Task Neural Networks for Speech Recognition Egorova, Ekaterina ; Veselý, Karel (oponent) ; Karafiát, Martin (vedoucí práce) The first part of this Master's thesis covers theoretical investigation into the principles and usage of neural networks, including their usability for the speech recognition tasks. Then it proceeds to summarize the multi-task neural networks' operating principles and some recent experiments with them. The practical part of the semester project reports changes made to a tool for neural network training which support multi-task training. Then the preparation of the settings is described, including a number of scripts written especially for this purpose. The experiments presented in the thesis explore the idea of using articulatory characteristics of phonemes as secondary tasks for multi-task training. The experiments are conducted on two different datasets of different quality and size and representing different languages - English and Vietnamese. Articulatory characteristics are occasionally combined with different secondary tasks, such as context, to see how well they function together. A comparison is made between the networks of different sizes to see how their size affects the effectiveness of multi-task training. These experiments show that multi-task training with the use of articulatory characteristics as secondary tasks can enhance training and yield better phoneme accuracy as a result. Finally, multi-task training is embedded to a speech recognition system as a feature extractor. Úplný záznam
	Vizualizace výstupu z řečových technologií pro potřeby kontaktních center Zhezhela, Oleksandr ; Szőke, Igor (oponent) ; Schwarz, Petr (vedoucí práce) Diplomová práce se zabývá vizualizací dat získaných pomocí řečových technologií pro potřeby kontaktních center. Jsou prozkoumány metody získávání informaci z řečových signálů a existující nástroje, které řeší podobné úlohy. Je analyzován rozsah dat, která lze z řečových technologií získat. Procesy a standardy používané v kontaktních centrech. Na základě požadavků pracovníků kontaktních center bylo implementováno uživatelské rozhraní pro vizualizaci dat a audio přehrávačznázorňující řečová data. Získané poznatky a řešení byly implementovány do nástroje Speech Analytics Server (SPAS). Úplný záznam
	Algoritmy rozpoznávání řeči na FPGA/DSP Urbiš, Oldřich ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce) Tato diplomová práce se zabývá návrhem algoritmů pro rozpoznání řeči s ohledem na výběr cílové technologie, kterou je platforma využívající technologie signálových procesorů a programovatelných hradlových polí. Algoritmy pro rozpoznávání řeči zahrnují, extrakci příznaků v podobě Melfrekvenčních cepstrálních koeficientů, skryté Markovovy modely a jejich vyhodnocení pomocí Viterbiho algoritmu. Úplný záznam
	Hybridní rozpoznávač izolovaných slov Veselý, Karel ; Černocký, Jan (oponent) ; Grézl, František (vedoucí práce) Rozpozávač izolovaných slov nezávislý na mluvčím má mnoho praktických použití. Například bude umožňovat ovládat hlasem různé domácí přístroje příští generace které budou komunikovat s PC. Ještě zajímavější je možnost jej vestavět do jakékoli aplikace nebo dokonce do operačního systému a rozšířit tak uživatelské rozhranní o nový prvek, hlasové ovládání. Dá se využít k ovládání pomocí klíčových slov, reakcí může být spuštění aplikace nebo jakákoli jiná specifická akce. Nejzajímavější možnost využití rozpoznávače izolovaných slov je v elektronických slovnících. Novým rysem slovníků příští generace by mohlo být hlasové vyhledávání slov. Velmi užitečná je možnost získat na výstupu seznam slov sežazený podle pravděpodobnosti vyslovení. Tento rys umožňuje uživateli jednoduše zjistit podobná slova a naučit se je lépe rozlišovat. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English