Název: Deep prior audio compression
Autoři: Švento, Michal ; Balušík, Peter
Typ dokumentu: Příspěvky z konference
Jazyk: eng
Nakladatel: Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií
Abstrakt: Audio compression is still an up-to-date topic because the demand for big data streams is rapidly increasing. Deep learning has brought up new algorithms that decrease bitrates with good perception quality. The novel approach in generative artificial intelligence is to produce new data from prior stored in network parameters, called a deep prior. The deep audio prior framework shows its success in various tasks such as inpainting, declipping, and bandwidth extension, but it has not been tested for compression. In this paper, we test this method with a prebuilt network for inpainting. Our idea of compression is based on reducing the number of time-frequency coefficients in the spectrogram while allowing the reconstruction of the original signal with high quality.
Klíčová slova: audio processing; compression; deep audio prior; deep learning
Zdrojový dokument: Proceedings I of the 30st Conference STUDENT EEICT 2024: General papers, ISBN 978-80-214-6231-1, ISSN 2788-1334

Instituce: Vysoké učení technické v Brně (web)
Informace o dostupnosti dokumentu: Plný text je dostupný v Digitální knihovně VUT.
Původní záznam: https://hdl.handle.net/11012/249240

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-622557

 Záznam vytvořen dne 2024-07-21, naposledy upraven 2024-07-21.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet