Original title:
Statistické strojové učení s aplikacemi v hudbě
Translated title:
Statistical machine learning with applications in music
Authors:
Janásková, Eliška ; Večeř, Jan (advisor) ; Hlávka, Zdeněk (referee) Document type: Master’s theses
Year:
2020
Language:
eng Abstract:
[eng][cze] The aim of this thesis is to train a computer on Beatles' songs using the re- search project Magenta from the Google Brain Team to produce its own music, to derive backpropagation formulas for recurrent neural networks with LSTM cells used in the Magenta music composing model, to overview machine learning techniques and discuss its similarities with methods of mathematical statistics. In order to explore the qualities of the artificially composed music more thor- oughly, we restrict ourselves to monophonic melodies only. We train three deep learning models with three different configurations (Basic, Lookback, and At- tention) and compare generated results. Even though the artificially composed music is not as interesting as the original Beatles, it is quite likeable. According to our analysis based on musically informed metrics, artificial melodies differ from the original ones especially in lengths of notes and in pitch differences be- tween consecutive notes. The artificially composed melodies tend to use shorter notes and higher pitch differences. 1Cílem této práce je vytvořit strojově generovanou hudbu na základě písní od Beatles s využitím výzkumného projektu Magenta od týmu Google Brain, odvodit vzorce pro backpropagaci v rekurentní neuronové síti s LSTM buňkami, kterou Magenta využívá, přiblížit techniky strojového učení a srovnat je s metodami matematické statistiky. Pro podrobnější rozbor uměle vytvořených skladeb se omezíme pouze na monofonní melodie. Natrénujeme tři modely hlubokého učení se třemi různými konfiguracemi (Basic, Lookback, and Atten- tion) a porovnáme jednotlivé výsledky. I přes to, že uměle vytvořené skladby nejsou tak poutavé jako původní Beatles, jsou docela líbivé. Na základě analýzy založené na hudebně informačních metrikách se uměle vygenerované melodie liší od těch originálních zejména v délce not a rozdílech výšek mezi po sobě jdoucími notami. Umělé vytvořené melodie používají kratší noty a rozdíly ve výškách po sobě jdoucích not jsou větší. 1
Keywords:
evaluation of music; machine learning; music composition; neural networks with LSTM; tensor flow; hodnocení hudby; hudební skladba; neuronové sítě s LSTM; strojové učení; tensor flow
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/116651