National Repository of Grey Literature 13 records found  1 - 10next  jump to record: Search took 0.01 seconds. 
Speech Analysis for Processing of Musical Signals
Mészáros, Tomáš ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Hlavním cílem této práce je obohatit hudební signály charakteristikami lidské řeči. Práce zahrnuje tvorbu audioefektu inspirovaného efektem talk-box: analýzu hlasového ústrojí vhodným algoritmem jako je lineární predikce, a aplikaci odhadnutého filtru na hudební audio-signál. Důraz je kladen na dokonalou kvalitu výstupu, malou latenci a nízkou výpočetní náročnost pro použití v reálném čase. Výstupem práce je softwarový plugin využitelný v profesionálních aplikacích pro úpravu audia a při využití vhodné hardwarové platformy také pro živé hraní. Plugin emuluje reálné zařízení typu talk-box a poskytuje podobnou kvalitu výstupu s unikátním zvukem.
Lossless Coding of Speech from Microphone Array
Myška, David ; Černocký, Jan (referee) ; Malenovský, Vladimír (advisor)
This bachelor's thesis deals with lossless coding of speech signals from microphone arrays. It describes the methods used in the FLAC reference codec and their variations to increase compression for signals from microphone arrays. The following describes methods for aligning channels for their subsequent processing. At the end of the work the results obtained are compared with the reference codec FLAC.
Lossless Encoding of Signals from Microphone Array
Kálazi, Adrián ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Bezeztrátové kódování zvuku je stále důležitější pro správnou archivaci a uchování zvuku v původní podobě. Pro dosažení dobrého kompresního poměru se na původní zvuk často aplikují techniky bezztrátového kódování, jako je lineární predikce a Riceho kódování, aby se minimalizovala jeho entropie a zachoval se původní signál s bitovou přesností se zmenšenou velikostí. Tato práce zkoumá možnosti efektivního kódování vícekanálového zvuku způsobem, který využívá podobnosti mezi více kanály za účelem dosažení lepších kompresních poměrů. Tato práce také hlouběji zkoumá techniky používané FLAC-em a zároveň poskytuje řešení několika problémů, které FLAC neřeší.
Transmission of Digital Information over Audio
Bujnovský, Michael ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Cílem této práce je umožnit přenést binární informace mezi dvěma zařízeními jen za pomocí zvuku. Práce začíná analýzou existujících řešení. Dále popisuje různé techniky digitální modulace, věnuje se synchronizaci a vlastnímu protokolu zapouzdřující data. Velkou částí práce jsou testy úspěšnosti přenosu za užití různých nastavení frekvencí a prostředí. Na základě výsledků testů je implementovaná uživatelská aplikace, umožňující demonstraci systému.
Music, Speech, Crying, Singing Detection in Audio (Video)
Danko, Michal ; Malenovský, Vladimír (referee) ; Szőke, Igor (advisor)
This thesis follows the trend of last decades in using neural networks in order to detect speech in noisy data. The text begins with basic knowledge about discussed topics, such as audio features, machine learning and neural networks. The network parameters are examined in order to provide the most suitable background for the experiments. The main focus of the experiments is to observe the influence of various sound events on the speech detection on a small, diverse database. Where the sound events correlated to the speech proved to be the most beneficial. In addition, the accuracy of the acoustic events, previously used only as a supplement to the speech, is also a part of experimentation. The experiment of examining the extending of the datasets by more fairly distributed data shows that it doesn't guarantee an improvement. And finally, the last experiment demonstrates that the network indeed succeeded in learning how to predict voice activity in both clean and noisy data.
Far-Field Speech Recognition
Žmolíková, Kateřina ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Systémy rozpoznávání řeči v dnešní době dosahují poměrně vysoké úspěšnosti. V případě řeči, která je snímána vzdáleným mikrofonem a je tak narušena množstvím šumu a dozvukem (reverberací), je ale přesnost rozpoznávání značně zhoršena. Tento problém je možné zmírnit využitím mikrofonních polí. Tato práce se zabývá technikami, které umožňují kombinovat signály z více mikrofonů tak, aby byla zlepšena kvalita výsledného signálu a tedy i přesnost rozpoznávání. Práce nejprve shrnuje teorii rozpoznávání řeči a uvádí nejpoužívanější algoritmy pro zpracování mikrofonních polí. Následně jsou demonstrovány a analyzovány výsledky použití dvou metod pro beamforming a metody dereverberace vícekanálových signálů. Na závěr je vyzkoušen alternativní způsob beamformingu za použití neuronových sítí.
Very Low Bit-Rate Speech Coding Based on Neural Networks
Jochman, Stanislav ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Vrámci tejto práce sme skúmali možnosti zlepšenia kvality zvuku produkovaným pomocou neurónovej siete LPCNet. Analyzovali sme vplyv použitia dátových setov zameraných na cieľový jazyk a ich vplyv na kvalitu výsledného zvuku. Pre meranie kvality kódovania reči sme využili hodnotiaci systém WARP-Q. Cieľom našej práce bolo navrhnúť vylepšenie trénovacieho dátového setu a použitie postfilterov pre zlepšenie kvality zvuku. Naše výsledky ukazujú merateľné zlepšenia s využitím malého slovenského dátového setu. Rovnako sme zaznamenali, že využitie dolnopriepustného filteru a filtra zlepšujúceho formanty zlepšilo kvalitu výsledného zvuku.
Lossless Encoding of Signals from Microphone Array
Kálazi, Adrián ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Bezeztrátové kódování zvuku je stále důležitější pro správnou archivaci a uchování zvuku v původní podobě. Pro dosažení dobrého kompresního poměru se na původní zvuk často aplikují techniky bezztrátového kódování, jako je lineární predikce a Riceho kódování, aby se minimalizovala jeho entropie a zachoval se původní signál s bitovou přesností se zmenšenou velikostí. Tato práce zkoumá možnosti efektivního kódování vícekanálového zvuku způsobem, který využívá podobnosti mezi více kanály za účelem dosažení lepších kompresních poměrů. Tato práce také hlouběji zkoumá techniky používané FLAC-em a zároveň poskytuje řešení několika problémů, které FLAC neřeší.
Transmission of Digital Information over Audio
Bujnovský, Michael ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Cílem této práce je umožnit přenést binární informace mezi dvěma zařízeními jen za pomocí zvuku. Práce začíná analýzou existujících řešení. Dále popisuje různé techniky digitální modulace, věnuje se synchronizaci a vlastnímu protokolu zapouzdřující data. Velkou částí práce jsou testy úspěšnosti přenosu za užití různých nastavení frekvencí a prostředí. Na základě výsledků testů je implementovaná uživatelská aplikace, umožňující demonstraci systému.
Lossless Coding of Speech from Microphone Array
Myška, David ; Černocký, Jan (referee) ; Malenovský, Vladimír (advisor)
This bachelor's thesis deals with lossless coding of speech signals from microphone arrays. It describes the methods used in the FLAC reference codec and their variations to increase compression for signals from microphone arrays. The following describes methods for aligning channels for their subsequent processing. At the end of the work the results obtained are compared with the reference codec FLAC.

National Repository of Grey Literature : 13 records found   1 - 10next  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.