Národní úložiště šedé literatury Nalezeno 65 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Automatické stahování dat z internetu pro trénování rozpoznávačů
Jeřábek, Jan ; Glembek, Ondřej (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce se zabývá návrhem a tvorbou aplikace pro usnadnění stahování audio dat z internetu pro trénování rozpoznávačů. Zabývá se výběrem vhodného zdroje dat a rozborem možností vyhledávání a stahování z vybraného média. Na těchto základech pak rozebírá výběr vhodých nástrojů a knihoven. Součástí je i rozbor implementace, zaměřený na popis klíčových části aplikace. Na závěr jsou shrnuty dosažené výsledky a návrhy na další rozšíření.
Implementation of Simple Speech Recognizer in a Web Browser
Crkoň, Jakub ; Glembek, Ondřej (oponent) ; Szőke, Igor (vedoucí práce)
The goal of this project is to implement simple speech recognizer for web browser. This paper describes fundamental components required for implementing speech recognizer and techniques which are used for optimization process of speech recognition in web browser. At first, the paper focuses on introduction of speech recognition theory. It describes individual parts and principles of speech recognizer. In next section, thesis describes design, implementation and principles of acceleration of speech recognizer with limited computing resources of web browser. The implementation is divided into modules making up the library for usage in web browser. The library is easily extendable and usable in various web applications. Finally, it discusses potential directions of development and usability of this project.
Detekce změny jazyka při hovoru
Povolný, Filip ; Glembek, Ondřej (oponent) ; Matějka, Pavel (vedoucí práce)
Tato práce se zabývá problematikou detekce změny jazyka při hovoru. V první části jsou popsány v současnosti používané metody diarizace jazyků. K implementaci byla vybrána metoda založená na akustickém přístupu identifikace jazyka s využitím směsi Gaussovských rozložení, i-vektoru a lineární diskriminační analýzy. Pro experimenty byla vytvořena mandarínsko-anglická databáze se střídáním jazyků. Na této databázi zvolený systém dosahuje úspěšnosti 89,3 % správně klasifikovaných segmentů.
Scrabble
Picek, Radomír ; Glembek, Ondřej (oponent) ; Smrž, Pavel (vedoucí práce)
Tato diplomová práce se zabývá stolní společenskou hrou SCRABBLE a její realizací v podobě počítačové hry. Postupně rozebírá všechny důležité aspekty, které mají vliv na výkonnost dané implementace. Především potom zvolení vhodných datových struktur pro uchování použité slovní zásoby, ovlivňujících efektivitu generování tahů a výběr vhodných algoritmů s ohledem na maximální rychlost. Zvláštní důraz je přitom kladen na inteligenci umělého protihráče a jeho schopnost konkurovat nejenom amatérům, ale i profesionálním hráčům SCRABBLU.
Hledání nových cest v rozpoznávání řečníka založeného na neuronových sítích
Sova, Damián ; Matějka, Pavel (oponent) ; Glembek, Ondřej (vedoucí práce)
Keďže zadanie tejto práce je veľmi široké, tak sa bolo treba sústrediť len na určitú sféru. Nakoniec, cieľom tejto práce je aplikovať optimalizačnú metódu Stochastického Spriemerovania Váh do tréningového procesu Hlbokej Neurónovej Siete. Po predstavení potrebných teoretických vedomostí v prvej časti práce, nasleduje druhá časť s priebehmi jednotlivých experimentov. V teoretickej časti je dôraz kladený hlavne na objasnenie celého životného cyklu trénovacieho a vyhodnocovacieho procesu, vrátane popisu jednotlivých komponentov. Praktická časť poskytuje podrobný pohľad na každý experiment, ktorých cieľom je demonštrovať dosiahnuteľnosť zvýšenia výkonnosti systému rozpoznávania rečníka. Celkové zlepšenie výkonu sa podarilo dosiahnuť postupným aplikovaním rôznych tréningových konfigurácií, v ktorých sa zohľadňujú skúsenosti z predchádzajúcich experimentov. Kľúčovou zložkou úspešného Stochastického Spriemerovania Váh v experimentoch bola dostatočne vysoká konštantná hodnota Miery Učenia s aplikovaným postupným prechodom alebo Cyklický priebeh Miery Učenia.
Síťový interface k detektoru klíčových slov
Skotnica, Martin ; Glembek, Ondřej (oponent) ; Szőke, Igor (vedoucí práce)
Rozpoznávání řeči je oblastí, která je v současné době celosvětově intenzivně studována. Systémy schopné rozpoznat mluvenou řeč se stávají součástí běžného života v mnoha aplikacích. Jednou z nich je i detekce klíčových slov, způsob jak odhalit výskyt určitých slov v datech. Detektor vyvinutý na VUT Fakultě informatiky nám umožňuje detekovat tyto slova. Cílem této práce je tedy navrhnout a implementovat síťový interface k detektoru klíčových slov na bázi klient/server. Cílová aplikace se připojí na server a posílá mu zvuková data. Server na tyto data spouští detektor klíčových slov a výsledek posílá zpět klientovi, kde se interaktivně zobrazí uživateli.
Optimization of Gaussian Mixture Subspace Models and Related Scoring Algorithms in Speaker Verification
Glembek, Ondřej ; Brummer, Niko (oponent) ; Campbell,, William (oponent) ; Burget, Lukáš (vedoucí práce)
This thesis deals with Gaussian Mixture Subspace Modeling in automatic speaker recognition. The thesis consists of three parts.  In the first part, Joint Factor Analysis (JFA) scoring methods are studied.  The methods differ mainly in how they deal with the channel of the tested utterance.  The general JFA likelihood function is investigated and the methods are compared both in terms of accuracy and speed.  It was found that linear approximation of the log-likelihood function gives comparable results to the full log-likelihood evaluation while simplyfing the formula and dramatically reducing the computation speed. In the second part, i-vector extraction is studied and two simplification methods are proposed. The motivation for this part was to allow for using the state-of-the-art technique on small scale devices and to setup a simple discriminative-training system.  It is shown that, for long utterances, while sacrificing the accuracy, we can get very fast and compact i-vector systems. On a short-utterance(5-second) task, the results of the simplified systems are comparable to the full i-vector extraction. The third part deals with discriminative training in automatic speaker recognition.  Previous work in the field is summarized and---based on the knowledge from the earlier chapters of this work---discriminative training of the i-vector extractor parameters is proposed.  It is shown that discriminative re-training of the i-vector extractor can improve the system if the initial estimation is computed using the generative approach.
Automatické generování šipek pro DDR
Skála, František ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce)
Cílem této práce je navržení metod vhodných pro automatickou tvorbu souborů šipek z hudebních souborů k taneční počítačové hře DDR. Tento problém je rozdělen na dvě hlavní fáze - detekci beatů, tedy stanovení tempa písničky, a samotnou tvorba šipek. Pro detekci beatů se využívá detekce nárůstů energií v jednotlivých frekvenčních pásmech a následné statistické zarovnání výsledků. Tvorba šipek pracuje obdobně, zaměřuje se však na detekci všech výrazných okamžiků hudby a obsahuje logiku pro rozmísťování šipek do jednotlivých směrů. Testování uživateli ukázalo, že má aplikace potenciál oslovit hráče hledající sadu jednoduchých šipek pro svou oblíbenou písničku. Kvalita detekce beatů dává prostor pro využití těchto postupů i mimo rámec ukázkové aplikace. V práci je též navrženo několik možných vylepšení použitých postupů.
Voice Dialog System in Web Browser for Demonstration Purposes
Vlček, Pavol ; Glembek, Ondřej (oponent) ; Schwarz, Petr (vedoucí práce)
This thesis describes how to prepare and design a voice-controlled assistant(voicebot), which can be deployed on any website as a modern way to communicate with customers using internet browsers. The main emphasis is put on synchronization between voice dialog and the graphical interface of the website. The synchronization can be achieved by transferring bidirectional voice and text commands between client and server. This is achieved by using WebRTC technology with SIP as a signaling protocol. The thesis deals with a wide range of protocols and technologies as well as interconnecting VoIP telephony, computer networks, and Phonexia speech technologies based on machine learning. As a result, deployment of the voicebot can reduce costs on outgoing calls, ease agents of a FAQ burden, and increase customers' interest in the product/company.
Granular Synthesis in Music Production
Pečinka, Pavel ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce)
The focus of this thesis is on designing and creating a granular synthesis application for music production. The application is implemented as a VST3 plugin with the use of JUCE framework and C++ programming language and is capable of interfacing with Digital Audio Workstations, or DAWs for short, which are programs that serve as a central point for music producers, where they can create new sounds, mix songs and create audio recordings among many other things. The plugin is designed as a sampler, able to load a sample file containing audio data and use this data for further processing and playback. Evaluation of user tests indicates, that the application can be successfully used for music production as a granular synthesis instrument.

Národní úložiště šedé literatury : Nalezeno 65 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.