National Repository of Grey Literature 217 records found  beginprevious100 - 109nextend  jump to record: Search took 0.00 seconds. 
Set of Computer Exercises for Signals and Systems
Pálka, Petr ; Žmolíková, Kateřina (referee) ; Černocký, Jan (advisor)
The goal of this bachelor thesis is to transform the current format of materials for computer exercises from the Signals and Systems course into Jupyter environment. Current materials are divided by topics into individual PDF files that contain relevant theory and MATLAB code examples. These PDF materials cover basics of digital signal processing on computer. Produced Jupyter notebooks contain theory from original materials in Markdown + LaTeX, and MATLAB code examples are replaced by Python examples. In addition to current materials, they display output of the Python code which may include graphs, playable audio, text, image or some interactive combination of listed.
Searching in Speech Data
Fapšo, Michal ; Černocký, Jan (referee) ; Szőke, Igor (advisor)
This thesis describes a designed and implemented system for efficient storage, indexing and search in collections of spoken documents that takes advantage of automatic speech recognition. As the quality of current speech recognizers is not sufficient for a great deal of applications, it is necessary to index the ambiguous output of the recognition, i.\,e. the acyclic graphs of word hypotheses -- recognition lattices. Then, it is not possible to directly apply the standard methods known from text--based systems. This paper discusses an optimized indexing system for efficient search in the complex and large data structures which are the output of the recognizer.
Out-of-Vocabulary Words Detection and Recovery
Egorova, Ekaterina ; Hannemann, Mirko (referee) ; Schaaf, Thomas (referee) ; Černocký, Jan (advisor)
Tato disertační práce zkoumá oblast zpracování slov mimo slovník (out-of-vocabulary word, OOV) v rámci úlohy automatického rozpoznávání řeči (automatic speech recognition, ASR). Definuje dvě samostatné úlohy zpracování OOV - detekci a obnovu - a pro obě úlohy navrhuje metriky úspěšnosti. Prezentuje několik přístupů k detekci a obnově OOV v rámci hybridních a end-to-end (E2E) ASR systémů. Experimentální práce a srovnání přístupů bylo provedeno na otevřené databázi LibriSpeech, aby byla zajištěna reprodukovatelnost experimentů.  Hybridní přístup využívá upravený dekódovací graf s fonémovými podřetězci a pro detekci a obnovu opakujících se OOV využívá reprezentaci založenou na plných rozpoznávacích grafech (lattices). Obnovená OOV jsou přidána do slovníku a jazykového modelu (LM), což vede ke zlepšení úspěšnosti ASR systému. Druhý přístup využívá k řešení úlohy detekce OOV vnitřní reprezentace systému E2E architektury "Listen Attend and Spell" (LAS) s predikcí slov. Tato metoda oproti hybridnímu přístupu výrazně zlepšuje míru úplnosti a přesnosti (recall a precision). Obnova opakujících se OOV se provádí pomocí samostatného systému predikce znaků s využitím detekovaných časových rámců a pravděpodobnostního shlukování.Nakonec navrhujeme novou "speller" architekturu se schopností učit se reprezentace OOV společně s trénováním sítě pro predikci slov (word predicting network, WPN). Komponent "speller" ovlivňuje během trénování slovní embeddingy tak, aby dobře reprezentovaly i fonetickou podobu slov, a tím zajišťuje nejen možnost kvalitní obnovy OOV, ale i zlepšení výkonu sítě pro predikci slov.
Web Application for Learning of Guitar Playing
Mikota, Michal ; Černocký, Jan (referee) ; Szőke, Igor (advisor)
Tools for teaching musical instruments have been with us for hundreds of years and, like everything else, have gradually adapted to the present day. However, a large number of these applications are overly complex, confusing, and generally unfriendly for their users. At the same time, there are only a handful of apps that have an implemented feature of real-time detection of the played note by the player, which is very desirable and necessary for beginner and moderately advanced guitar players. This bachelor thesis demonstrates and explains the implementation of the various tools needed for teaching using techniques for dominant frequency detection and filtering out unwanted audio artifacts using an algorithm from the field of convolutional neural networks. At the same time, the goal is to focus on the robustness of the algorithm, i.e., it can detect and determine the played tone on the guitar even in noisy environments. The algorithm used by the individual tools developed within this application, combined with a simple user interface, provide the alternative for teaching how to play guitar.
Web Application for Learning of Guitar Playing
Mikota, Michal ; Černocký, Jan (referee) ; Szőke, Igor (advisor)
Tools for teaching musical instruments have been with us for hundreds of years and, like everything else, have gradually adapted to the present day. However, a large number of these applications are overly complex, confusing, and generally user-unfriendly for their users. At the same time, there are only a handful of apps that have an implemented feature of real-time detection of the played note by the player, which is very desirable and necessary for beginner and slightly advanced guitar players. This bachelor thesis demonstrates and explains the implementation of the various tools needed for teaching using techniques for dominant frequency detection and filtering out unwanted audio artifacts using an algorithm from the field of convolutional neural networks. At the same time, the goal is to focus on the robustness of the algorithm, i.e., it can detect and determine the played tone on the guitar even in noisy environments. The algorithm used by the individual tools developed within this application, combined with a simple user interface, provide the alternative for teaching how to play guitar
Very Low Bit-Rate Speech Coding Based on Neural Networks
Jochman, Stanislav ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Vrámci tejto práce sme skúmali možnosti zlepšenia kvality zvuku produkovaným pomocou neurónovej siete LPCNet. Analyzovali sme vplyv použitia dátových setov zameraných na cieľový jazyk a ich vplyv na kvalitu výsledného zvuku. Pre meranie kvality kódovania reči sme využili hodnotiaci systém WARP-Q. Cieľom našej práce bolo navrhnúť vylepšenie trénovacieho dátového setu a použitie postfilterov pre zlepšenie kvality zvuku. Naše výsledky ukazujú merateľné zlepšenia s využitím malého slovenského dátového setu. Rovnako sme zaznamenali, že využitie dolnopriepustného filteru a filtra zlepšujúceho formanty zlepšilo kvalitu výsledného zvuku.
Text-to-Speech Personalization
Luner, Michal ; Černocký, Jan (referee) ; Brukner, Jan (advisor)
Tato práce si klade za cíl vytvořit model, který dokáže převést vstupní text na řeč cílového mluvčího. Základním stavebním kamenem je VITS model. Postup byl následující: získal se obecný český dataset, na kterém se natrénoval model neuronové sítě, jenž se poté využil pro generování audio nahrávek, které se vyhodnocovaly pomocí objektivních metrik. Následně se vytvořil personalizovaný dataset, na kterém se provedl fine-tuning modelu získaného v předchozím kroku. Opět se provedlo vyhodnocení kvality nahrávek. Výsledkem jsou dva personalizované modely. Model mužského mluvčího dosáhl v poslechových testech skóre 4.12/5 (MOS), model ženské mluvčí pak 3.02/5. Výsledky sub\-jektivních i objektivních metrik ukázaly, že postupem zvoleným v této práci je možné vyvinout model, který se svou kvalitou generovaných nahrávek blíží skutečné řeči. Přínosem této práce je, kromě personalizovaných modelů, i vytvoření vyhodnocovacího systému zpracování dat, které je možno uzpůsobit k evaluaci audio nahrávek z jiných mo\-de\-lů. Práce popisuje i způsob tvorby nového datasetu, který se může využít při tvorbě dalšího jiného datasetu v libovolném jazyce.
Visualizing Neural Network Used as a Language Model
Ryšánek, Jakub ; Černocký, Jan (referee) ; Beneš, Karel (advisor)
LSTM sít je typ neuronové sítě, která je určena na analýzu sekvenčních dat. Výhodou LSTM oproti jednoduché rekurentní neuronové síti je schopnost ukládat dlouhodobé závis- losti, což umožňuje dosahovat vyšší úspěšnosti při provádění úloh jako je rozpoznávání řeči nebo jazykové modelování. Avšak vzhledem z jejich komplexitě není zcela jasné jak přesně fungují. Abych prozkoumal jejich vnitřní chování tak jsem vytvořil tři vizualizační metody. Tyto metody se zaměřují na vzor chování jednotlivých prvků modelu nebo na chování celého modelu při zpracování slov s podobným syntaktickým nebo sémantickým významem.
Sound Effect "Glitch Machine"
Cimmerman, Matej ; Mošner, Ladislav (referee) ; Černocký, Jan (advisor)
This thesis addresses software music effects and their implementation. It shows design and implementation of the Glitch Machine, which belongs to the music multieffect programs and demonstrates the simultaneous use of various music effects to process audio signals. The result is a program for Windows OS, which utilizes cooperation of various effects, namely a filter, reverb, distortion, extractor, reverz, stutter, shifter, pitch resample and gain. It allows extensive and detailed editing of an audio track and a higher extent of manipulation with sounds, than with single music effects. Other components of the program include visualisations of the waveform and frequency spectrum of audio signals and an option for loading and saving effect presets. The program was tested in tests of the performance and memory usage and also with user testing of quality and graphical interface.
Granular Synthesis in Music Production
Pečinka, Pavel ; Glembek, Ondřej (referee) ; Černocký, Jan (advisor)
Cílem této práce je navrhnout a vytvořit aplikaci pro granulární syntézu, využitelnou v hudbení produkci. Aplikace je implementována jako VST3 zásuvný modul s využitím frameworku JUCE a programovacího jazyka C++ a je schopná propojení s programy typu Digital Audio workstation, zkráceně DAW, což jsou programy sloužící jako centrální bod pro hudební producenty, kde mohou mimo jiné vytvářet nové zvuky, provádět mixování skladeb a vytvářet zvukové nahrávky. Tento zásuvný modul je navržen jako sampler a je schopen nahrát zvukový soubor obsahující audio data, která dále využívá pro další zpracování a následné přehrávání. Z vyhodnocení uživatelského testování vyplývá, že je tato aplikace použitelná pro hudební produkci jako nástroj pro granulární syntézu.

National Repository of Grey Literature : 217 records found   beginprevious100 - 109nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.