Národní úložiště šedé literatury Nalezeno 134 záznamů.  začátekpředchozí41 - 50dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Zobrazení a analýza aktivit neuronové sítě ve skrytých vrstvách
Fábry, Marko ; Grézl, František (oponent) ; Karafiát, Martin (vedoucí práce)
Cílem této práce je vytvořit systém schopný zobrazení hodnot aktivačních funkcí neuronů nacházejících se v skrytých vrstvách neuronových sítí použitých na rozpoznávání řeči. Dále byly na tomto systému provedeny experimenty porovnávající vizualizační metody, vizualizace neuronových sítí s různými architekturami a s různými druhy vstupních dat. Vizualizační systém implementovaný v rámci této práce je založen na předchozí práci pana Khe Chai Sim a rozšířen o nové způsoby normalizace vstupních dat. Pro přípravu trénovacích dat neuronových sítí byl použit framework Kaldi. Pro samotné trénování neuronových sítí byl použit nový framework CNTK. Jádro práce - samotný vizualizační systém byl implementován v skriptovacím jazyce Python.
Fixed-point implementace rozpoznávače řeči
Král, Tomáš ; Černocký, Jan (oponent) ; Burget, Lukáš (vedoucí práce)
Táto diplomová práca sa zaoberá problematikou automatického rozpoznávania reči na systémoch s obmedzenými hardwarovými prostriedkami - embedded systems. Cieľom projektu je navrhnúť a implementovať systém rozpoznávania reči na embedded systémy, ktoré nedisponujú floating-point výpočetnými jednotkami. V prvom rade bola zvolená vhodná hardwarová architektúra a s ohľadom na dostupné prostriedky, ktorými vybraná architektúra disponuje, bolo navrhnuté riešenie rozpoznávania reči. Jednotlivé časti systému rozpoznávania boli následne v priebehu vývoja optimalizované do takej podoby, aby mohli byť nasadené na zvolený HW. Výsledkom práce je dosiahnutie rozpoznávania českých čísloviek na embedded systéme.
Dynamický dekodér pro rozpoznávání řeči
Veselý, Michal ; Glembek, Ondřej (oponent) ; Schwarz, Petr (vedoucí práce)
Výstupem této práce je funkční a značně optimalizovaná implementace dynamického dekodéru, která funguje na principu dynamického generování rozpoznávací sítě a dekódování modifikovaným algoritmem Token Passing. Implementované řešení poskytuje srovnatelné výsledky se vzorovým statickým dekodérem z BSCORE (API firmy Phonexia), přičemž přináší výraznou paměťovou úsporu, která umožňuje využití více komplexních jazykových modelů a usnadňuje integraci do mobilních zařízení či dynamické přidávání nových slov do rozpoznávače.
Online detekce jednoduchých příkazů v audiosignálu
Zezula, Miroslav ; Březina, Lukáš (oponent) ; Krejsa, Jiří (vedoucí práce)
Tato práce popisuje vývoj hlasového modulu, který je schopen rozpoznávat jednoduché řečové povely na základě porovnání zvukového vstupu s uloženými vzory. První část práce obsahuje popis použitého algoritmu a ověření jeho funkčnosti. Algoritmus je založen na Mel-frekvenčních cepstrálních koeficientech a dynamickém borcení času. Dále je navržen hardware hlasového modulu, obsahující signálový kontrolér 56F805 firmy Freescale. Signál z mikrofonu je upraven operačními zesilovači a digitálním filtrem. Třetí část se zabývá vývojem software pro kontrolér a popisuje implementaci algoritmu v pevné řádové čárce s ohledem na omezené možnosti kontroléru. Závěrečná zkouška prokazuje použitelnost modulu v prostředí s nízkým obsahem šumu.
Implementace jednoduchého rozpoznávače řeči pro Android
Flajšingr, Petr ; Herout, Adam (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce se zabývá implementací a optimalizací rozpoznávače řeči pod operačním systémem Android. Pokrývá implementaci nahrávání zvukového signálu, následnou extrakci příznaků pomocí Mel bank filtrů a neuronové sítě. Také obsahuje informace o implementaci dynamického dekodéru. Práce se věnuje převážně implementaci v nízkoúrovňových nástrojích jako jsou Android NDK a Renderscript a vyhodnocuje úspěšnost rozpoznávače a jeho paměťové a časové nároky.
Application of Mean Normalized Stochastic Gradient Descent for Speech Recognition
Klusáček, Jan ; Hradiš, Michal (oponent) ; Pešán, Jan (vedoucí práce)
The artificial neural networks are on the rise in recent years. One possible optimization technique is mean-normalized stochastic gradient descent recently proposes by Wiesler et al. [1]. This work further explains and examines this method on phoneme classification task. Not all findings of Wiesler et al. can be confirmed. The mean-normalized SGD is helpful only if the network is large enough (but not too deep) and if the sigmoid non-linear function is used. Otherwise, the mean-normalized SGD slightly impairs the network performance and therefore cannot be recommended as a general optimization technique. [1] Simon Wiesler, Alexander Richard, Ralf Schluter, and Hermann Ney. Mean-normalized stochastic gradient for large-scale deep learning. In Acoustics, Speech and Signal Processing (ICASSP), 2014 IEEE International Conference on, pages 180{184. IEEE, 2014.
Implementace jednoduchého rozpoznávače řeči pro Android
Čuba, Eduard ; Glembek, Ondřej (oponent) ; Szőke, Igor (vedoucí práce)
Cieľom projektu je vytvoriť jednoduchý rozpoznávač reči pre platformu Android. Práca rozoberá základné komponenty rozpoznávača reči a venuje sa technikám, ktoré boli použité pre optimalizáciu procesu rozpoznávača reči na zariadeniach so systémom Anrdoid. Ako prvá je popísaná teória extrakcie akustických príznakov, odhadu posteriórnych pravdepodobností fonémov a dynamického dekódovania. Následnej je popísaný dizajn a implementácia dekodéra, ktorý prevádza sériu rečových príznakov na text, za použitia obmedzených výpočetných prostriedkov mobilného zariadenia. Implementácia je rozdelená do modulov tvoriacich knižnicu, ktorú je možno jednoducho rozšíriť, či integrovať do požadovanej aplikácie. Do rozpoznávača je taktiež možné dodať vlastné modely, ktoré môžu byť navrhnuté a natrénované pre konkrétne použitie. V experimentoch sme skúmali rôzne prístupy ku modelovaniu abstraktných dátových štruktúr pre reprezentáciu rozpoznávacej siete tak. V závere práca rozoberá potencionálne smery budúceho vývoja a aplikácií tohoto projektu.
Ovládání kooperativních robotů hlasem
Bubla, Lukáš ; Němec, Zdeněk (oponent) ; Lacko, Branislav (vedoucí práce)
Cílem diplomové práce bylo vytvoření programu, pomocí kterého bude možné ovládat kolaborativního robota pomocí hlasu. Úvodní kapitoly obsahují rešerši současného stavu v oblasti kolaborativní robotiky z hlediska bezpečnosti, efektivity práce, programování a komunikace s robotem. Dále je rozebírána problematika strojového zpracování lidského hlasu. V praktické části byl navržen experiment, ve kterém se pracuje s off-line simulací robota UR3 v prostředí PolyScope 3.15.0. Tato simulace byla propojena s programem, psaným v programovacím jazyku Python, který využívá knihovny SpeechRecognition a urx. Pro ovládání robota byly navrženy jednoduché hlasové pokyny, které uvádějí robota do pohybu na definované pozice.
Hybridní rozpoznávač izolovaných slov
Veselý, Karel ; Černocký, Jan (oponent) ; Grézl, František (vedoucí práce)
Rozpozávač izolovaných slov nezávislý na mluvčím má mnoho praktických použití. Například bude umožňovat ovládat hlasem různé domácí přístroje příští generace které budou komunikovat s PC. Ještě zajímavější je možnost jej vestavět do jakékoli aplikace nebo dokonce do operačního systému a rozšířit tak uživatelské rozhranní o nový prvek, hlasové ovládání. Dá se využít k ovládání pomocí klíčových slov, reakcí může být spuštění aplikace nebo jakákoli jiná specifická akce. Nejzajímavější možnost využití rozpoznávače izolovaných slov je v elektronických slovnících. Novým rysem slovníků příští generace by mohlo být hlasové vyhledávání slov. Velmi užitečná je možnost získat na výstupu seznam slov sežazený podle pravděpodobnosti vyslovení. Tento rys umožňuje uživateli jednoduše zjistit podobná slova a naučit se je lépe rozlišovat.
Ve stopách Leoše Janáčka - převod řeči na hudbu
Marciniak, Petr ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce)
Tato bakalářská práce popisuje vývoj aplikace pro převod řeči z nahrávky ve formátu WAV na hudbu uloženou ve formátu MIDI. V úvodní části je čtenář uveden do problematiky. Následuje popis teoretických základů zpracování řeči a následného generování hudby. Dále jsou diskutovány počáteční experimenty, jako generování základní melodie, průměrování tónů, detekce slabik atp., za účelem určení, které z těchto technik mají pozitivní vliv na poslouchatelnost vytvořené hudby, a proto by měly být ve výsledné aplikaci implementovány. Následně jsou definována základní kritéria krásy z hlediska generování hudby a jsou diskutovány různé skladatelské techniky, jako např. inverze tónů nebo změna tempa. Následuje popis implementace a vyhodnocení provedených testů. V závěrečné části je celá práce zhodnocena a je zde i krátké zamyšlení nad možnými dalšími směry vývoje tohoto systému. V příloze je možné najít uživatelský manuál k aplikaci a dále také seznam nástrojů použitých pro implementaci.

Národní úložiště šedé literatury : Nalezeno 134 záznamů.   začátekpředchozí41 - 50dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.