National Repository of Grey Literature 216 records found  beginprevious90 - 99nextend  jump to record: Search took 0.01 seconds. 
Voice Conversion
Schwarz, Ivan ; Szőke, Igor (referee) ; Černocký, Jan (advisor)
Thesis is dedicated to the making of a system for voice conversion. To methods, which alter voice of one person in a way, that it could be possible for listener to mislead it for someone elses voice. In the first part, Harmonic plus Noise Model (HNM) is described. Signal analysis and synthesis are its main purposes. Methods of voice conversion are considered in the second part. Prosodic modifications are introduced at first and then modification of a spectral envelope is discussed (Especially aplication of conversion matrices). Dynamic Time Warping (DTW) and Linear Prediction Coding (LPC) methods are explained briefly. In last section, implementation process is described and achived results are discussed. Ways of further development are suggested in summary.
Microphone Arrays for Speaker Recognition
Mošner, Ladislav ; Plchot, Oldřich (referee) ; Černocký, Jan (advisor)
Tato diplomová práce se zabývá problematikou vzdáleného rozpoznávání mluvčích. V případě dat zachycených odlehlým mikrofonem se přesnost standardního rozpoznávání značně snižuje, proto jsem navrhl dva přístupy pro zlepšení výsledků. Prvním z nich je použití mikrofonního pole (záměrně rozestavené sady mikrofonů), které je schopné nasměrovat virtuální "paprsek" na pozici řečníka. Dále jsem prováděl adaptaci komponent systému (PLDA skórování a extraktoru i-vektorů). S využitím simulace pokojových podmínek jsem syntetizoval trénovací a testovací data ze standardní datové sady NIST 2010. Ukázal jsem, že obě techniky a jejich kombinace vedou k výraznému zlepšení výsledků. Dále jsem se zabýval společným určením identity a pozice mluvčího. Zatímco výsledky ve venkovním simulovaném prostředí (bez ozvěn) jsou slibné, výsledky z interiéru (s ozvěnami) jsou smíšené a vyžadují další prozkoumání. Na závěr jsem mohl systémem vyhodnotit omezené množství reálných dat získaných přehráním a záznamem nahrávek ve skutečné místnosti. Zatímco výsledky pro mužské nahrávky odpovídají simulaci, výsledky pro ženské nahrávky nejsou přesvědčivé a vyžadují další analýzu.
Detection of Pre-Recorded Messages in Speech
Boboš, Dominik ; Matějka, Pavel (referee) ; Černocký, Jan (advisor)
Rozpoznání před-nahraných zpráv v řeči (tzv. plechové huby) je užitečné pro jakékoliv následující dolování informací v řečových datech. Tato práce shrnuje teorii hledání podobných promluv v řeči a efektivní přístupy k porovnání dvou sekvencí. Ke zkoumání identifikace opakujících se informací v audiu je nutné mít velké množství dat s přesně se opakujícími úseky. Takovou datovou sadu jsme vygenerovali smícháním předem nahraných zpráv s telefonními hovory se změnami rychlosti, hlasitosti a opakování. Náš systém řeší scénáře "známých zpráv a "neznámých zpráv pomocí shlukování nebo detekce v blocích. Porovnali jsme techniky dynamického borcení času (DTW), přibližné shody řetězců a rekurentní kvantifikační analýzy, a nakonec jsme všechny uvedené techniky zkombinovali a získali tak přesný a efektivně pracující systém.
Sound Creation Using VST
Švec, Michal ; Schimmel, Jiří (referee) ; Černocký, Jan (advisor)
This diploma thesis deals with digital sound synthesis. The main task was to design and implement new sound synthesizer. Created tool uses different approaches to the sound synthesis, so it can be described as a hybrid. Instrument design was inspired by existing audio synthesizers. For implementation, C++ language and VST technology from Steinberg are used. As an extension, a module, that can process voice or text input and then build a MIDI file with melody (which can be interpreted with using any synthesizer) was designed and implemented. For this module, Python language is used. For the synthesizer, a simple graphical user interface was created.
Modification of Vocal Tracks in SW Post-Production of Music
Trkal, Tomáš ; Beran, Vítězslav (referee) ; Černocký, Jan (advisor)
This thesis describes a design and an implementation of a vocal tracks processing application. The application consists of several sub-modules representing audio processors and effects. It is implemented as a plugin created with the VST technology. The plugin provides a simple control system and an integrated database of presets which help mainly less experienced users to significantly speed up the process of processing the vocal tracks. The user evaluation shows that application is successful both in creating demos and professional mixing of music tracks.
Time-Domain Neural Network Based Speaker Separation
Peška, Jiří ; Černocký, Jan (referee) ; Žmolíková, Kateřina (advisor)
A thesis is about the usage of convolutional neural networks for automatic speech separation in an acoustic environment. The goal is to implement the neural network by following a TasNet architecture in the PyTorch framework, train this network with various values of hyper-parameters, and to compare the quality of separations based on the size of the network. In contrast to older architectures that transformed an input mixture into a time-frequency representation, this architecture uses a convolutional autoencoder, which transforms input mixture into a non-negative representation optimized for a speaker extraction. Separation is achieved by applying the masks, which are estimated in the separation module. This module consists of stacked convolutional blocks with increasing dilation, which helps with modeling of the long-term time dependencies in processed speech. Evaluation of the precision of the network is measured by a signal to distortion (SDR) metric, by a perceptual evaluation of speech quality (PESQ), and the short-time objective intelligibility (STOI). The Wall Street Journal dataset (WSJ0) has been used for training and evaluation. Trained models with various values of hyper-parameters enable us to observe the dependency between the size of the network and SDR value. While smaller network after 60 epochs of training reached 10.8 dB of accuracy, a bigger network reached 12.71 dB.
Use of GPU as Accelerator - Technology OpenCL
Kobrtek, Jozef ; Polok, Lukáš (referee) ; Černocký, Jan (advisor)
This work discusses usage of graphics card and OpenCL API for acceleration of real-time audio resampling. This work contains also analysis of current graphics cards architectures and performance tests comparing CPU and GPU implementations, and integration with Steinberg VST interface.
Algorithmic Trading Using Artificial Neural Networks
Šeda, Jan ; Černocký, Jan (referee) ; Szőke, Igor (advisor)
The capability to be able to determine the future progression on the worlds stock exchange is an important issue, which has become discernible in the last decades. An important role of this progression lies within the fast advancements in computerized technology. Aforementioned document describes a mechanism used for prediction of the future price of a certain stock. The strategy of trading is build upon this mechanism, and the core of this prediction system is an artificial neural network. Inputs used in this network are indicators derived from technical analysis. This trading system was implemented into historical trades and successfully tested.
Far-Field Speech Recognition
Žmolíková, Kateřina ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Systémy rozpoznávání řeči v dnešní době dosahují poměrně vysoké úspěšnosti. V případě řeči, která je snímána vzdáleným mikrofonem a je tak narušena množstvím šumu a dozvukem (reverberací), je ale přesnost rozpoznávání značně zhoršena. Tento problém je možné zmírnit využitím mikrofonních polí. Tato práce se zabývá technikami, které umožňují kombinovat signály z více mikrofonů tak, aby byla zlepšena kvalita výsledného signálu a tedy i přesnost rozpoznávání. Práce nejprve shrnuje teorii rozpoznávání řeči a uvádí nejpoužívanější algoritmy pro zpracování mikrofonních polí. Následně jsou demonstrovány a analyzovány výsledky použití dvou metod pro beamforming a metody dereverberace vícekanálových signálů. Na závěr je vyzkoušen alternativní způsob beamformingu za použití neuronových sítí.
Set of Computer Exercises for Signals and Systems
Pálka, Petr ; Žmolíková, Kateřina (referee) ; Černocký, Jan (advisor)
The goal of this bachelor thesis is to transform the current format of materials for computer exercises from the Signals and Systems course into Jupyter environment. Current materials are divided by topics into individual PDF files that contain relevant theory and MATLAB code examples. These PDF materials cover basics of digital signal processing on computer. Produced Jupyter notebooks contain theory from original materials in Markdown + LaTeX, and MATLAB code examples are replaced by Python examples. In addition to current materials, they display output of the Python code which may include graphs, playable audio, text, image or some interactive combination of listed.

National Repository of Grey Literature : 216 records found   beginprevious90 - 99nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.