Název:
Reverzní inženýring mixáže pomocí neuronové sítě
Překlad názvu:
Reverse engineering of an audio mix using neural networks
Autoři:
Čermák, Jerguš ; Mokrý, Ondřej (oponent) ; Rajmic, Pavel (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2024
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Bakalárska práca sa zaoberá využitím algoritmov neurónovej siete za účelom zistenia parametrov signálových procesorov použitých pri mixáži zvukových stôp. V rámci práce sú prezentované lineárne signálové procesory \emph{Gain}, \emph{Pan}, \emph{Filter} a \emph{Reverb} umožňujúce úpravu zvukového signálu a vytvorenie stereofónneho mixu zvukovej nahrávky. Následne sú vďaka implementácií pomocou knižnice DDSP použité v zmysle vrstiev modelu neurónovej siete, ktorý je zameraný na predikciu parametrov použitých pri mixáži, za predpokladu znalosti vstupných stôp a cieľového mixu. V rámci práce boli vytvorené stereofónne mixy, ktorých parametre boli následne odhadované pomocou dvoch modelov neurónovej siete. Výsledky boli posudzované ako objektívnymi, tak subjektívnymi metódami (posluchovým testom).
This bachelor's thesis focuses on the use of neural network algorithms to determine the parameters of signal processors used in the mixing of audio tracks. The thesis presents linear signal processors such as \emph{Gain}, \emph{Pan}, \emph{Filter}, and \emph{Reverb}, which are commonly used to process audio signal and to produce a stereo mix of the audio recording. These processors are subsequently used within the neural network model as layers, implemented using the DDSP library, aimed at predicting the parameters used in the mix, given the knowledge of the input tracks and the target mix. Resultantly, stereo mixdowns were created, and their parameters were estimated using two neural network models. The results were evaluated using both objective measurements and subjective methods (listening test).
Klíčová slova:
DDSP; LTI zvukové efekty; Neurónové siete; stereofónna mixáž; DDSP; LTI audio effects; Neural networks; stereo mixdown
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: https://hdl.handle.net/11012/247357