Národní úložiště šedé literatury Nalezeno 13 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Speech Analysis for Processing of Musical Signals
Mészáros, Tomáš ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
The primary goal of the thesis is to enhance musical signals with signs of human speech. This involves the creation of an audio effect inspired by the talk-box, by analyzing the vocal tract with a suitable algorithm like linear prediction and applying the calculated filter to the musical audio signal. An emphasis is given to excellent output audio quality, low latency and small processing overhead for real-time use. The outcome is a usable software plug-in targeted to professional audio editing applications and for live performance as well using a suitable hardware platform. It will emulate the real talk-box equipment or provides similar audio quality with a unique sound. 
Bezeztrátové kódování řeči z mikrofonního pole
Myška, David ; Černocký, Jan (oponent) ; Malenovský, Vladimír (vedoucí práce)
Tato bakalářská práce se zabývá bezeztrátovým kódování řečových signálů z mikrofonních polích. Uvádí popis metod použitých v referenčním kodeku FLAC a jejich obměny pro zvýšení komprese pro signály z mikrofonních polí. Dále uvádí popis metod pro zarovnání kanálů pro jejich následné zpracování. Na konci práce jsou zhodnoceny dosažené výsledky v porovnání s referenčním kodekem FLAC.
Lossless Encoding of Signals from Microphone Array
Kálazi, Adrián ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
Lossless audio coding is increasingly important for properly archiving and preserving audio in its original form. To achieve a good compression ratio, lossless encoding techniques such as linear prediction and Rice coding are often applied to the original audio in order to minimize its entropy and preserve the original signal bit-precisely with a reduced size. This thesis explores the possibilities of efficiently encoding multi-channel audio in a way that exploits the similarity between multiple channels in order to achieve better compression ratios. This thesis also explores the techniques employed by FLAC in more depth while also providing solutions to a few problems that FLAC fails to address.
Transmission of Digital Information over Audio
Bujnovský, Michael ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
The aim of this work is to transfer binary information between two devices just by usage of sound. The work starts with the analysis of existing solutions. Following by descriptions of different modulation techniques, synchronization and own protocol used in application. Significant part of the work is a test of transmission success rate in different setting of frequencies and environments. Based on results, I programmed user-friendly application showing system.
Identifikace hudby, řeči, křiku, zpěvu v audio (video) záznamu
Danko, Michal ; Malenovský, Vladimír (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce navazuje na trend posledních desetiletí ve využívaní neuronových sítí za účelem odhalení řeči v zašuměných datech. Text začíná základními poznatky o probíraných tématech, jako jsou audio příznaky, strojové učení a neuronové sítě. Síťové parametry jsou zkoumány s cílem poskytnout nejvhodnější zázemí pro experimenty. Hlavní úkol experimentů je sledovat vliv různých zvukových událostí na detekci řeči na malé a různorodé databáze. Přičemž se ukázalo, že nejvýhodnější jsou zvukové události v korelaci s řečí. Kromě toho, přesnost akustických událostí, dříve použita pouze jako doplněk k přesnosti řeči, je také součástí experimentování. Experiment zkoumání datových sad rozšiřených o více spravedlivě rozděleny data ukázal, že samotné rozšiření nezaručuje zlepšení. Na závěr, poslední experiment demonstruje, že síti se skutečně podařilo naučit, jak předpovědět hlasové aktivity v obou případech čistých i zašuměných dat.
Far-Field Speech Recognition
Žmolíková, Kateřina ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
The accuracy of speech recognition systems today is very high. However, when speech is captured by a far-field microphone, it can be severely distorted by noise and reverberation and the performance of speech recognition degrades significantly. One way to alleviate this problem is to use microphone arrays. This thesis addresses the methods of combining signals from multiple microphones to improve the quality of the signal and final speech recognition accuracy. It summarizes the theory of speech recognition and the most popular techniques for array processing. Afterwards, it demonstrates and analyzes the results obtained by two different methods for beamforming and a method for dereverberation of multichannel signals. Finally, it examines an alternative way of performing beamforming using neural networks.
Very Low Bit-Rate Speech Coding Based on Neural Networks
Jochman, Stanislav ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
During this work, we focused on replicating and enhancing results by using the neural network LPCNet. We compared audio quality from the pre-trained model and our models trained on smaller datasets, thus reducing training time and improving audio quality. We determined that using a language-specific dataset can produce greater results in that specific language than a big general model. We measured the quality of speech of the pre-trained model and our models using WARPQ ranking score 5.2.4. We also examined possibilities of improving audio quality by filtering output audio using output post-filters and formant-enhancing filters. Our results show measurable improvement in audio quality using the suggested methods.
Lossless Encoding of Signals from Microphone Array
Kálazi, Adrián ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
Lossless audio coding is increasingly important for properly archiving and preserving audio in its original form. To achieve a good compression ratio, lossless encoding techniques such as linear prediction and Rice coding are often applied to the original audio in order to minimize its entropy and preserve the original signal bit-precisely with a reduced size. This thesis explores the possibilities of efficiently encoding multi-channel audio in a way that exploits the similarity between multiple channels in order to achieve better compression ratios. This thesis also explores the techniques employed by FLAC in more depth while also providing solutions to a few problems that FLAC fails to address.
Transmission of Digital Information over Audio
Bujnovský, Michael ; Malenovský, Vladimír (oponent) ; Černocký, Jan (vedoucí práce)
The aim of this work is to transfer binary information between two devices just by usage of sound. The work starts with the analysis of existing solutions. Following by descriptions of different modulation techniques, synchronization and own protocol used in application. Significant part of the work is a test of transmission success rate in different setting of frequencies and environments. Based on results, I programmed user-friendly application showing system.
Bezeztrátové kódování řeči z mikrofonního pole
Myška, David ; Černocký, Jan (oponent) ; Malenovský, Vladimír (vedoucí práce)
Tato bakalářská práce se zabývá bezeztrátovým kódování řečových signálů z mikrofonních polích. Uvádí popis metod použitých v referenčním kodeku FLAC a jejich obměny pro zvýšení komprese pro signály z mikrofonních polí. Dále uvádí popis metod pro zarovnání kanálů pro jejich následné zpracování. Na konci práce jsou zhodnoceny dosažené výsledky v porovnání s referenčním kodekem FLAC.

Národní úložiště šedé literatury : Nalezeno 13 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.