Název:
Rozpoznávání žánru populárních skladeb
Překlad názvu:
Recognising the Genre of Popular Songs
Autoři:
Čižmár, Filip ; Janoušek, Vladimír (oponent) ; Zbořil, František (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2022
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Cieľom práce je zoznámiť sa s princípmi práce so zvukom v programovacom jazyku Python a s problematikou konvolučných neurónových sietí s cieľom tvorby webovej aplikácie schopnej rozpoznávať žáner nahranej skladby. V práci sú opísané princípy strojového učenia so zameraním na konvolučné neurónové siete. Zásadná časť práce je venovaná prieskumu dostupných datasetov pre účely získavania informácií z hudby. Ďalej je opísaný priebeh prípravy vybraného datasetu a transformácie zvukovej informácie do podoby spektrogramov pre učenie konvolučnej neurónovej siete. V rámci práce boli vytvorené dva modely schopné rozpoznávať žáner hudby. Prvý z nich je všeobecný a druhý so zameraním na podžánre elektronickej hudby. Výsledkom je webová aplikácia, ktorá po nahraní skladby zobrazí pravdepodobnosti zaradenia do jednotlivých žánrov.
The aim of this thesis is to get acquainted with the principles of working with sound in the Python programming language and with the issue of convolutional neural networks in order to create a web application capable of recognizing the genre of an uploaded song. The thesis describes the principles of machine learning with a focus on convolutional neural networks. A considerable part of this thesis is devoted to the research of available datasets created for the purpose of music information retrieval. Next, the process of preparation of the selected dataset and transformation of audio information into spectrograms for the learning of convolutional neural networks is described. Two models capable of recognizing the genre of music were created as a part of the thesis. First, for general, more popular genres and the second focuses on subgenres of electronic music. The result is a web application that, after a song is uploaded, displays the probabilities of classification into individual genres.
Klíčová slova:
elektronická hudba; Fourierove transformácie; hudba; konvolučné neurónové siete.; neurónové siete; populárne skladby; spektrogramy; strojové učenie; Zvuk; žánre hudby; convolutional neural networks.; electronic music; Fourier transforms; machine learning; music; music genres; neural networks; popular songs; Sound; spectrograms
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/207379