National Repository of Grey Literature 15 records found  1 - 10next  jump to record: Search took 0.01 seconds. 
Deep prior audio compression
Švento, Michal ; Balušík, Peter
Audio compression is still an up-to-date topic because the demand for big data streams is rapidly increasing. Deep learning has brought up new algorithms that decrease bitrates with good perception quality. The novel approach in generative artificial intelligence is to produce new data from prior stored in network parameters, called a deep prior. The deep audio prior framework shows its success in various tasks such as inpainting, declipping, and bandwidth extension, but it has not been tested for compression. In this paper, we test this method with a prebuilt network for inpainting. Our idea of compression is based on reducing the number of time-frequency coefficients in the spectrogram while allowing the reconstruction of the original signal with high quality.
Audio visualizer
Jelínková, Jana ; Schimmel, Jiří (referee) ; Říha, Kamil (advisor)
The aim of this thesis is to create an audio visualizer. That means an object, whose parameters will be changed in real time based on chosen parameters of an audio. The first part of this thesis deals with different kinds of audio visualizers through history till today and also deals with some artistic theories about visualization. The second part deals with the main solution of the visualizer in Pure Data and principles used for audio processing and also describes development of an external for Pure Data.
Smart Sheet Music Reader for Android
Smejkal, Vojtěch ; Herout, Adam (referee) ; Szőke, Igor (advisor)
Oblasti jako automatické otáčení stránek nebo automatický hudební doprovod jsou studovány již několik desetiletí. Tato práce shrnuje současné metody pro počítačové sledování not v reálném čase. Zabývá se také hudebními příznaky jako jsou chroma třídy a syntetizované spektrální šablony. Dále popisuje klíčové části systému jako krátkodobou Fourierovu transformaci a Dynamické borcení času. V rámci projektu byl navrhnut a vyvinut vlastní systém pro sledování pozice hráče v notách, který byl následně implementován jako mobilní aplikace. Výsledný systém dokáže sledovat i skladby s výrazně odlišným tempem, pauzami během hry nebo drobnými odchylkami od předepsaných not.
Network Interface for Keyword Spotting System
Skotnica, Martin ; Glembek, Ondřej (referee) ; Szőke, Igor (advisor)
A considerable part of the research in computer science is dedicated to speech recognition as the speech-controlled systems become useful in many applications. One of them is the keyword spotting which makes possible to find words in audio data. Such a detector is developed at BUT Faculty of Information Technology. The goal of this work is to propose a network interface to this keyword detector based on client/server architecture. Client connects to the server and sends audio data. Server runs keyword detector with this received data and sends the result of keyword spotting back to client. Finally client visualizes the result and interact with user.
Parameter Visualization of Multichannel Audio System in Web Browser
Lach, Martin ; Glembek, Ondřej (referee) ; Szőke, Igor (advisor)
This work deals with Audified Audio Processing System. This embedded system includes an Arm processor running the Linux operating system. At present, parameter control (phantom, gain) is complicated, without feedback. In this work, the creation of server - client application, which will allow easy setting of the mentioned parameters and will show their effect, is described.
System for a Room Acoustics Measurement
Stojan, Martin ; Mošner, Ladislav (referee) ; Szőke, Igor (advisor)
This work follows up on Marin Lach's thesis. It deals with Audified Audio Processing System. The work is about making control of the system more pleasant, testing the functionality of the system with eventual modifications, extending the current functionality and creating a web application to ease the collecting of metadata about the recording. It also contains manuals for dealing with the system and using the mentioned applications.
Lossless Encoding of Signals from Microphone Array
Kálazi, Adrián ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Bezeztrátové kódování zvuku je stále důležitější pro správnou archivaci a uchování zvuku v původní podobě. Pro dosažení dobrého kompresního poměru se na původní zvuk často aplikují techniky bezztrátového kódování, jako je lineární predikce a Riceho kódování, aby se minimalizovala jeho entropie a zachoval se původní signál s bitovou přesností se zmenšenou velikostí. Tato práce zkoumá možnosti efektivního kódování vícekanálového zvuku způsobem, který využívá podobnosti mezi více kanály za účelem dosažení lepších kompresních poměrů. Tato práce také hlouběji zkoumá techniky používané FLAC-em a zároveň poskytuje řešení několika problémů, které FLAC neřeší.
Parameter Visualization of Multichannel Audio System in Web Browser
Lach, Martin ; Glembek, Ondřej (referee) ; Szőke, Igor (advisor)
This work deals with Audified Audio Processing System. This embedded system includes an ARM processor running the Linux operating system. At present, parameter control (phantom, gain) is complicated, without feedback. In this work, the creation of web application, which will allow easy setting of the mentioned parameters and will show their effect, is described.
Lossless Encoding of Signals from Microphone Array
Kálazi, Adrián ; Malenovský, Vladimír (referee) ; Černocký, Jan (advisor)
Bezeztrátové kódování zvuku je stále důležitější pro správnou archivaci a uchování zvuku v původní podobě. Pro dosažení dobrého kompresního poměru se na původní zvuk často aplikují techniky bezztrátového kódování, jako je lineární predikce a Riceho kódování, aby se minimalizovala jeho entropie a zachoval se původní signál s bitovou přesností se zmenšenou velikostí. Tato práce zkoumá možnosti efektivního kódování vícekanálového zvuku způsobem, který využívá podobnosti mezi více kanály za účelem dosažení lepších kompresních poměrů. Tato práce také hlouběji zkoumá techniky používané FLAC-em a zároveň poskytuje řešení několika problémů, které FLAC neřeší.
System for a Room Acoustics Measurement
Stojan, Martin ; Mošner, Ladislav (referee) ; Szőke, Igor (advisor)
This work follows up on Marin Lach's thesis. It deals with Audified Audio Processing System. The work is about making control of the system more pleasant, testing the functionality of the system with eventual modifications, extending the current functionality and creating a web application to ease the collecting of metadata about the recording. It also contains manuals for dealing with the system and using the mentioned applications.

National Repository of Grey Literature : 15 records found   1 - 10next  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.