National Repository of Grey Literature 14 records found  previous11 - 14  jump to record: Search took 0.00 seconds. 
Lossless Coding of Speech from Microphone Array
Myška, David ; Černocký, Jan (referee) ; Malenovský, Vladimír (advisor)
This bachelor's thesis deals with lossless coding of speech signals from microphone arrays. It describes the methods used in the FLAC reference codec and their variations to increase compression for signals from microphone arrays. The following describes methods for aligning channels for their subsequent processing. At the end of the work the results obtained are compared with the reference codec FLAC.
Far-Field Speech Recognition
Žmolíková, Kateřina ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Systémy rozpoznávání řeči v dnešní době dosahují poměrně vysoké úspěšnosti. V případě řeči, která je snímána vzdáleným mikrofonem a je tak narušena množstvím šumu a dozvukem (reverberací), je ale přesnost rozpoznávání značně zhoršena. Tento problém je možné zmírnit využitím mikrofonních polí. Tato práce se zabývá technikami, které umožňují kombinovat signály z více mikrofonů tak, aby byla zlepšena kvalita výsledného signálu a tedy i přesnost rozpoznávání. Práce nejprve shrnuje teorii rozpoznávání řeči a uvádí nejpoužívanější algoritmy pro zpracování mikrofonních polí. Následně jsou demonstrovány a analyzovány výsledky použití dvou metod pro beamforming a metody dereverberace vícekanálových signálů. Na závěr je vyzkoušen alternativní způsob beamformingu za použití neuronových sítí.
Music, Speech, Crying, Singing Detection in Audio (Video)
Danko, Michal ; Malenovský, Vladimír (referee) ; Szőke, Igor (advisor)
This thesis follows the trend of last decades in using neural networks in order to detect speech in noisy data. The text begins with basic knowledge about discussed topics, such as audio features, machine learning and neural networks. The network parameters are examined in order to provide the most suitable background for the experiments. The main focus of the experiments is to observe the influence of various sound events on the speech detection on a small, diverse database. Where the sound events correlated to the speech proved to be the most beneficial. In addition, the accuracy of the acoustic events, previously used only as a supplement to the speech, is also a part of experimentation. The experiment of examining the extending of the datasets by more fairly distributed data shows that it doesn't guarantee an improvement. And finally, the last experiment demonstrates that the network indeed succeeded in learning how to predict voice activity in both clean and noisy data.
Speech Analysis for Processing of Musical Signals
Mészáros, Tomáš ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Hlavním cílem této práce je obohatit hudební signály charakteristikami lidské řeči. Práce zahrnuje tvorbu audioefektu inspirovaného efektem talk-box: analýzu hlasového ústrojí vhodným algoritmem jako je lineární predikce, a aplikaci odhadnutého filtru na hudební audio-signál. Důraz je kladen na dokonalou kvalitu výstupu, malou latenci a nízkou výpočetní náročnost pro použití v reálném čase. Výstupem práce je softwarový plugin využitelný v profesionálních aplikacích pro úpravu audia a při využití vhodné hardwarové platformy také pro živé hraní. Plugin emuluje reálné zařízení typu talk-box a poskytuje podobnou kvalitu výstupu s unikátním zvukem.

National Repository of Grey Literature : 14 records found   previous11 - 14  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.