Národní úložiště šedé literatury Nalezeno 217 záznamů.  začátekpředchozí90 - 99dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Transmission of Digital Information over Audio
Bujnovský, Michael ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
The aim of this work is to transfer binary information between two devices just by usage of sound. The work starts with the analysis of existing solutions. Following by descriptions of different modulation techniques, synchronization and own protocol used in application. Significant part of the work is a test of transmission success rate in different setting of frequencies and environments. Based on results, I programmed user-friendly application showing system.
Konverze hlasu
Schwarz, Ivan ; Szőke, Igor (oponent) ; Černocký, Jan (vedoucí práce)
Práce je věnována tvorbě systému pro konverzi hlasu. Metodám, jež hlas jednoho člověka upraví tak, aby ho bylo možné zaměnit za hlas člověka jiného. V první části je popsán harmonický a šumový model (HNM), který se stará o analýzu a syntézu signálů. Druhá část se zabývá metodami konverze. Nejprve jsou uvedeny prozodické změny a následně i možnosti modifikace spektrální obálky, zejména použití konverzních matic. Stručně je zde vysvětlena metoda dynamického borcení času (DTW) a metoda kódování pomocí lineární predikce (LPC). V poslední části je uveden způsob implementace, popsán průběh testování a jsou diskutovány dosažené výsledky. V závěru jsou nastíněny možnosti dalšího vývoje.
Microphone Arrays for Speaker Recognition
Mošner, Ladislav ; Plchot, Oldřich (oponent) ; Černocký, Jan (vedoucí práce)
This thesis addresses the problem of remote speaker recognition. The accuracy of standard speaker recognition decreases considerably in the presence of far-field data, therefore, we devised two strategies to improve the results. First, we employed a microphone array (purposely positioned set of microphones) that is able to steer a virtual "beam" to the position of the speaker. We also performed system adaptation of different parts of the system (PLDA scoring and i-vector extraction). We have synthesized our training and test data from the standard NIST 2010 data by room simulation and we have shown that both techniques and their combination significantly improve the results. We have also dealt with joint speaker identity and position estimation. While the results in simulated outdoor environment (reverberation-free) are encouraging, the results from interiors (with reverberation) are mixed and require further investigation. Finally, we were able to test our system on a limited amount of real re-transmitted data. While the results for male speakers match the simulation, the results for females are not convincing and need further analysis.
Detection of Pre-Recorded Messages in Speech
Boboš, Dominik ; Matějka, Pavel (oponent) ; Černocký, Jan (vedoucí práce)
Recognition of pre-recorded messages in speech is useful for any follow-up speech data mining. This thesis summarises the theory of searching similar utterances in speech and efficient approaches to compare two sequences. To investigate identification of redundant information in audio, it is necessary to have a large amount of data with the exact phrases repeated multiple times. We generated a dataset by mixing pre-recorded messages into phone calls with variations in speed, volume and repetitions. Our system tackles known messages and unknown messages'' scenarios by using approaches like clustering or detection in chunks. Dynamic time warping, approximate string matching and recurrent quantification analysis are compared, and finally, all mentioned techniques are combined to obtain a precise and efficient system.
Tvorba zvuku v technologii VST
Švec, Michal ; Schimmel, Jiří (oponent) ; Černocký, Jan (vedoucí práce)
Tato diplomová práce se zabývá problematikou digitální zvukové syntézy. Jejím hlavním úkolem bylo navrhnout a implementovat nový zvukový syntezátor. Vytvořený nástroj využívá různé přístupy k syntéze zvuku, proto je ho možné označit jako hybridní. Návrh nástroje byl inspirován existujícími audio syntezátory. Pro implementaci byl zvolen jazyk C++ a technologie VST od společnosti Steinberg. Jako rozšíření byl navržen a realizován modul, který dokáže zpracovat hlasový nebo textový vstup a na jeho základě vytvořit MIDI soubor, který je možné pomocí syntezátoru interpretovat. Pro tento modul je použitý jazyk Python. K vytvořenému syntezátoru vzniklo i jednoduché uživatelské rozhraní.
Úprava vokálních stop v SW post-produkci hudby
Trkal, Tomáš ; Beran, Vítězslav (oponent) ; Černocký, Jan (vedoucí práce)
Tato práce se zabývá návrhem a implementací aplikace pro zpracování vokálních stop. Aplikace je složena z několika dílčích modulů reprezentujících zvukové procesory a efekty a je realizována v podobě pluginu vytvořeného pomocí technologie VST. Plugin disponuje jednoduchým systémem ovládání a integrovanou databází presetů, jenž pomáhají převážně méně zkušeným uživatelům výrazně urychlit proces zvukového zpracování vokálních stop. Z uživatelského hodnocení vyplývá, že aplikaci lze úspěšně využít jak při tvorbě demonahrávek, tak i pro profesionální mix hudebních skladeb.
Separace mluvčích v časové doméně pomocí neuronové sítě
Peška, Jiří ; Černocký, Jan (oponent) ; Žmolíková, Kateřina (vedoucí práce)
Práce se zabývá využitím konvolučních neuronových sítí pro automatickou separaci mluvčích v akustickém prostředí. Cílem je implementovat neuronovou síť podle architektury TasNet za použití frameworku PyTorch, natrénovat síť s různými hodnotami hyperparametrů a porovnat kvalitu separací vzhledem k velikosti síťě.   Architektura oproti dosavadním metodám, které převáděly vstupní směs do časově-frekvenční reprezentace, používá konvoluční autoenkodér, který vstupní směs převádí do nezáporné reprezentace, která je optimalizovaná pro extrakci jednotlivých mluvčích. Samotné separace je docíleno aplikací masek, které jsou odhadnuty v separačním modulu. Modul tvoří opakující se posloupnost konvolučních bloků se zvyšující se dilatací, která napomáhá k modelování časových závislostí ve zpracovávané směsi.   K vyhodnocení přesnosti byly použity metriky signal to distortion ratio (SDR), dále perceptual evaluation of speech quality (PESQ) a short-time objective intelligibility (STOI). Trénování a vyhodnocování proběhlo za použití Wall Street Journal datasetu (WSJ0). Natrénováním několika modelů s různými hodnotami hyperparametrů bylo možno pozorovat závislost mezi velikostí sítě a hodnotou SDR. Zatímco menší síť dosahovala, po 60 epochách trénování, přesnosti 10.8 dB, větší síť dosahovala až 12.71 dB.
Využití grafického procesoru jako akcelerátoru - technologie OpenCL
Kobrtek, Jozef ; Polok, Lukáš (oponent) ; Černocký, Jan (vedoucí práce)
Tato práce pojednává o použití grafické karty a rozhraní OpenCL pro akceleraci převzorkování signálu při zpracování zvuku v reálném čase. V práci je analyzována architektura současných grafických karet a programovací model OpenCL, v testech je porovnán výkon GPU a CPU implementace algoritmu. Popsána je též integrace GPU implementace s rozhraním Steinberg VST.
Algoritmické obchodování na burze s využitím umělých neuronových sítí
Šeda, Jan ; Černocký, Jan (oponent) ; Szőke, Igor (vedoucí práce)
Určení vývoje ceny na světových trzích je aktuální problematikou, která v posledních dekádách nabývá na významu. Důležitou roli v tom sehrává rozvoj výpočetní techniky. V této práci je navržen mechanizmus pro predikci budoucí ceny na trhu. Na základě toho je pak sestavena obchodní strategie. Jádro predikčního systému používá pro svou činnost umělé neuronové sítě. Vstupem sítě jsou pak vybrané indikátory technické analýzy trhu. Obchodní systém byl implementován a úspěšně ověřen na historických datech.
Far-Field Speech Recognition
Žmolíková, Kateřina ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
The accuracy of speech recognition systems today is very high. However, when speech is captured by a far-field microphone, it can be severely distorted by noise and reverberation and the performance of speech recognition degrades significantly. One way to alleviate this problem is to use microphone arrays. This thesis addresses the methods of combining signals from multiple microphones to improve the quality of the signal and final speech recognition accuracy. It summarizes the theory of speech recognition and the most popular techniques for array processing. Afterwards, it demonstrates and analyzes the results obtained by two different methods for beamforming and a method for dereverberation of multichannel signals. Finally, it examines an alternative way of performing beamforming using neural networks.

Národní úložiště šedé literatury : Nalezeno 217 záznamů.   začátekpředchozí90 - 99dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.