Název:
Rozpoznání hudebního slohu z orchestrální nahrávky za pomoci technik Music Information Retrieval
Překlad názvu:
Recognition of music style from orchestral recording using Music Information Retrieval techniques
Autoři:
Jelínková, Jana ; Zvončák, Vojtěch (oponent) ; Kiska, Tomáš (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Pojem klasická hudba obsahuje, stejně jako žánry populární hudby, mnoho žánrových variant. Cílem práce je pomocí strojového učení rozlišit tyto žánrové varianty z orchestrálních nahrávek. Tato práce se zaměřuje na skladby z období od konce 16. století do začátku 20. století, jedná se tedy o baroko, klasicismus a romantismus. K identifikaci těchto tří hudebních slohů je využita metoda Music Information Retrieval, která spočívá v získávání parametrů z nahrávek a jejich evaluaci. Evaluované parametry jsou využity jako vstupní data pro klasifikátory. Klasifikace probíhá pomocí metod strojového učení, konkrétně se jedná o algoritmy kNN (K-Nearest Neighbor, v češtině k-nejbližší soused), LDA (Linear Discriminant Analysis, lineárně diskriminační analýza), GMM (Gaussian Mixture Models, Gaussovy smíšené modely) a SVM (Support Vector Machines, podpůrné vektory). V závěru práce je shrnuta dosažená úspěšnost jednotlivých klasifikačních algoritmů. Výsledky ukázaly, že značná odlišnost barokního slohu od zbylých dvou slohů, umožňuje jeho velmi přesnou klasifikaci. Naproti tomu klasicismus vykazuje velkou podobnost s romantismem a jeho identifikace proto dosahuje nižší úspěšnosti. Toto zjištění je ve shodě s předpokladem, který vychází z hudebně-teoretické charakteristiky slohů, která je popsána v první kapitole této práce.
As all genres of popular music, classical music consists of many different subgenres. The aim of this work is to recognize those subgenres from orchestral recordings. It is focused on the time period from the very end of 16th century to the beginning of 20th century, which means that Baroque era, Classical era and Romantic era are researched. The Music Information Retrieval (MIR) method was used to classify chosen subgenres. In the first phase of MIR method, parameters were extracted from musical recordings and were evaluated. Only the best parameters were used as input data for machine learning classifiers, to be specific: kNN (K-Nearest Neighbor), LDA (Linear Discriminant Analysis), GMM (Gaussian Mixture Models) and SVM (Support Vector Machines). In the final chapter, all the best results are summarized. According to the results, there is significant difference between the Baroque era and the other researched eras. This significant difference led to better identification of the Baroque era recordings. On the contrary, Classical era ended up to be relatively similar to Romantic era and therefore all classifiers had less success in identification of recordings from this era. The results are in line with music theory and characteristics of chosen musical eras.
Klíčová slova:
baroko; Error-Correcting Output Codes; extrakce parametrů; Gaussian Mixture Models; Gaussovy smíšené modely; hudební slohy; K-Nearest Neighbor; k-nejbližší soused; klasicismus; Linear Discriminant Analysis; lineárně diskriminační analýza; maximální relevance; minimální redundance; Music Information Retrieval; orchestrální nahrávky; podpůrné vektory; romantismus; strojové učení; Support Vector Machines; Wavelet Scattering; Baroque era; Classical era; Error-Correcting Output Codes; Gaussian Mixture Models; historical periods of music; K-Nearest Neighbor; Linear Discriminant Analysis; machine learning; minimum Redundancy Maximum Relevance method; Music Information Retrieval method; orchestral recordings; parameters extraction; Romantic era; Support Vector Machine; Wavelet Scattering
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/189407