Název:
Detektor tempa hudebních nahrávek na bázi neuronové sítě
Překlad názvu:
Tempo detector based on a neural network
Autoři:
Suchánek, Tomáš ; Smékal, Zdeněk (oponent) ; Ištvánek, Matěj (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2021
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Diplomová práce se zabývá systémy k detekci tempa a dob v hudebních nahrávkách, jejichž funkčnost je založena na neuronových sítích. Je zde popsána struktura těchto systémů a způsob zpracování signálu v jejich jednotlivých blocích. Pozornost je potom věnována především rekurentním a temporálním konvolučním sítím, které ze své podstaty detekci tempa a dob dokáží efektivně řešit. Vybrané metody, architektury sítí a jejich modifikace jsou pak implementovány v rámci uceleného detekčního systému, který je dále testován a vyhodnocen procesem křížové validace na žánrově rozmanitém datasetu. Z výsledků vyplývá, že systém s vlastní architekturou temporální konvoluční sítě dosahuje srovnatelných výsledků se zahraničními publikacemi – v rámci datasetu SMC se například projevil jako nejúspěšnější, naopak v případě jiných se nacházel mírně pod přesností state-of-the-art systémů, přičemž navržená síť si i přes zvýšenou vnitřní komplexnost zachovává nízkou výpočetní náročnost.
This Master’s thesis deals with beat tracking systems, whose functionality is based on neural networks. It describes the structure of these systems and how the signal is processed in their individual blocks. Emphasis is then placed on recurrent and temporal convolutional networks, which by they nature can effectively detect tempo and beats in audio recordings. The selected methods, network architectures and their modifications are then implemented within a comprehensive detection system, which is further tested and evaluated through a cross-validation process on a genre-diverse data-set. The results show that the system, with proposed temporal convolutional network architecture, produces comparable results with foreign publications. For example, within the SMC dataset, it proved to be the most successful, on the contrary, in the case of other datasets it was slightly below the accuracy of state-of-the-art systems. In addition,the proposed network retains low computational complexity despite increased number of internal parameters.
Klíčová slova:
Detekce tempa a dob; konvoluční neuronové sítě; mel spektrogram; neuronové sítě; prav-děpodobnostní model; rekurentní neuronové sítě; strojové učení; temporální konvolučníneuronové sítě; Beat tracking; convolutional neural networks; machine learning; mel spectrogram; neuralnetworks; probabilistic model; recurrent neural networks; temporal convolutional neuralnetworks
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/197107