Original title:
Generování polyfonní hudby pomocí neurových sítí
Translated title:
Generating polyphonic music using neural networks
Authors:
Židek, Marek ; Hajič, Jan (advisor) ; Maršík, Ladislav (referee) Document type: Bachelor's theses
Year:
2017
Language:
cze Abstract:
[cze][eng] Cílem této práce je prozkoumat nové možnosti v generovaní unikátních polyfonních skladeb s použitím neuronových sítí. Generovaní hudby, ať už pomocí zvukových vln nebo diskrétních reprezentací je velmi zajimvé a v posledních letech zkoumané téma. Tato práce používá jako trénovací data klasickou polyfonní hudbu reprezentovanou ve formátu midi. Nejdříve v práci popíšeme problém, předvedeme relevantní architektury neuronových sítí a poté vysvětlíme naše nápady, ze kterých jeden, a to náš experiment se třemi verzemi přidávání "skip-connections" do modelu LSTM pro generaci hudby, považujeme za kvalitní příbytek do tohoto odvětví. U podobných prací byly "skip-connections" úspěšně zkoumány hlavně pro problémy klasifikace, nicméně naše výsledky ukazují slušné vyledky pro generaci hudby (např. 47% našich respondentů považovalo naše generované vzorky za realné). Kromě standartní automatizované evaluace na testovacích datech, která je pro generování hudby hůře uchopitelná, je v práci provedena velmi komplexní evaluace pomocí dotazníků. Tato evaluace byla navržena ne pouze pro předvedení výsledků naší práce, ale také pro odhalení zajimavých souvislostí o očekávání, předsudků a charakteristik respondentů. Toto považujeme za hodnotný zdroj informací pro budoucí práce o automatickém generování hudby.The aim of this thesis is to explore new ways of generating unique polyphonic music using neural networks. Music generation, either in raw audio waveforms or discretely represented, is very interesting and under a heavy ex- ploration in recent years. This thesis works with midi represented polyphonic classical music for piano as training data. We introduce the problem, show rele- vant neural network architectures and describe our numerous ideas, out of which one idea, our experiment with three versions of skip residual LSTM connections for music composition, we consider a good contribution to the field. In related work, skip-connections were explored mostly for classification tasks, however, our results show a solid improvement for music composition (e.g. 47% of respondents considered our samples real). We also show that skip-connections have rather diverse hyperparameter space for future tuning. Apart from standard automated test set evaluation, which is hard to design and interpret for creativity mimicking models, we also did a complex evaluation through surveys. The evaluation was specifically designed to not only to show results for our samples, but to reveal information about expectancy, preconceptions and influence of personal charac- teristics of the respondents. We consider this a valuable...
Keywords:
computational composition; deep learning; Music generation; recurrent neural networks; Generování hudby; hluboké učení; počítačová kompozice; rekurentní neuronové sítě
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/90459