Název:
Aplikace pro separaci kytarového zvuku z hudební nahrávky
Překlad názvu:
Application for Guitar Sound Separation from Music Recording
Autoři:
Holková, Natália ; Rohdin, Johan Andréas (oponent) ; Mošner, Ladislav (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2023
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
Cieľom tejto práce bolo implementovať model na separáciu gitarového zvuku z nahrávky a použiť ho v praktickej aplikácii. Bolo nutné manuálne vytvoriť vlastný trénovací dataset z remixov piesní a upraviť existujúci MedleyDB dataset pre naše účely. Ako základ neurónovej siete sme si vybrali Demucs architektúru, ktorú sme od základu učili rozdeľovať audio súbory na celkovo päť samostatných nahrávok obsahujúcich bicie, basgitaru, vokály, gitaru a zvyšné nástroje. Celkovo sme na MetaCentre natrénovali päť rôznych modelov, ktoré boli objektívne aj subjektívne vyhodnotené. Implementovaná aplikácia slúži ako hudobný prehrávač a zároveň výučbový nástroj. Hlavnou funkcionalitou je, že umožňuje používateľovi počúvať izolovaný nástroj, napríklad gitaru, a vďaka tomu sa ľahšie učia piesne podľa sluchu. Aplikácia bola podrobená užívateľskému testovaniu a zistené poznatky budú využité pri ďalšom vývoji.
This thesis aims to implement a model capable of separating guitar sounds from a recording and use it in a practical application. It was necessary to manually create our dataset from remixes of songs and modify the existing MedleyDB dataset for our purposes. We have chosen Demucs architecture as a basis for our neural network. We trained it from scratch to separate audio files into five distinct recordings containing drums, bass, vocals, guitars, and other accompaniment. We trained five models on MetaCentrum, which we evaluated objectively and subjectively. The implemented application serves as both a music player and an educational tool. The main feature is to allow users to listen to isolated instruments, for example, a guitar, and therefore more easily learn songs by ear. The application was subjected to user testing, and the knowledge learned will be used in future development.
Klíčová slova:
Demucs; guitar sound separation; music source separation; neural networks; PyQt; Python; PyTorch; Demucs; neurónové siete; PyQt; Python; PyTorch; separácia gitarového zvuku; separácia hudobných zdrojov
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/211953