Národní úložiště šedé literatury Nalezeno 32 záznamů.  začátekpředchozí23 - 32  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Webové rozhraní pro vizualizaci zvukových parametrů
Putz, Viliam ; Ištvánek, Matěj (oponent) ; Miklánek, Štěpán (vedoucí práce)
Táto práca sa zaoberá spôsobmi extrakcie zvukových parametrov zo zvukových súborov, vizualizáciou týchto parametrov a následne implementáciou programu webového rozhrania, ktoré zabezpečuje túto vizualizáciu. V úvode je všeobecne popísaný odbor Music Information Retrieval, s ktorým táto práca úzko súvisí. Popísaný je taktiež súčasný stav v oblasti aplikácií pre extrakciu zvukových parametrov. Uvedené sú najznámejšie knižnice v tejto oblasti pre viacero programovacích jazykov. V druhej kapitole sú pomenované a popísané zvukové parametre, ktoré je možné z audio súboru extrahovať. Nasleduje popis spôsobu implementácie, použité technológie, diagram funkcií webového rozhrania, vysvetlenie funkčnosti a taktiež je popísané užívateľské rozhranie a jeho funkcie.
Systém pro nalezení duplikátů nahrávek na základě audio informace
Švejcar, Michael ; Miklánek, Štěpán (oponent) ; Ištvánek, Matěj (vedoucí práce)
Tato diplomová práce se zabývá metodami pro rozpoznání hudebních duplikátů v databázi souborů. Problém tkví v tom, že soubory hudebních duplikátů nemusí být vždy zcela shodné - mohou se lišit například v kvalitě či obsaženém potlesku na konci jedné z nahrávek. Cílem bylo navrhnout a implementovat systém, který shodné nahrávky identifikuje, vzájemně k sobě přiřadí a zapíše do výstupního souboru. Systém by měl být dostatečně robustní vůči již zmíněným drobným rozdílům mezi duplikáty, zároveň by měl být natolik přesný, aby nedocházelo k chybnému přiřazení vzájemně neshodných nahrávek. K těmto účelům byl použit programovací jazyk Python společně s dostupnými knihovnami pro výpočet chromagramů, techniky Image Hashing a různých variant algoritmu dynamického borcení časové osy. V rámci výsledného systému byly implementované tři různé metody, lišící se v jejich přesnosti a výpočetní náročnosti. Metody byly následně otestované na předem připraveném datasetu a na základě získaných výsledků byly vytvořeny čtyři různé úrovně přednastavené přesnosti výsledného systému. Výsledný systém se jeví jako vysoce přesný a zároveň robustní vůči nahrávkám, které jsou si velmi podobné, nikoli však shodné, jako je tomu u různých interpretací stejné skladby.
Neural Networks With Dilated Convolutions For Sound Event Recognition
Miklanek, Stepan
Convolutional neural networks, most commonly deployed in image classification tasks,typically use square-shaped convolutional kernels, which are well suited for feature extraction fromtwo-dimensional data. This study explores the effect of utilizing spectrally aware dilated convolutionsspecialized for sound event recognition. By extending the base kernels in the time or the frequencydimension, the features extracted from the spectral audio representations should, in theory, bettercapture the temporal and timbral information of different sound events. The baseline neural networkmodel with squared kernels was compared against three models, which used an increasing dilationfactor in the subsequent convolutional layers. The three models were purposefully tuned to focustowards the frequency and time feature extraction. The results have shown that the models withdilated convolutions performed noticeably better in comparison with the baseline model.
Extrakce parametrů pro výzkum interpretačního výkonu
Laborová, Anna ; Miklánek, Štěpán (oponent) ; Ištvánek, Matěj (vedoucí práce)
Rozdílné interpretace stejné skladby se mohou mezi sebou zásadně lišit. Nejen skladatel a noty definují posluchačův hudební zážitek, ale i charakteristická interpretace je integrální částí hudebního díla. Pro objektivní analýzu interpretačního výkonu jsou parametry rozděleny do čtyř tříd – z hlediska času (tempa), hlasitosti (dynamiky), témbru a výšky tónu. Každý parametr nebo jejich kombinace může ovlivnit výsledný unikátní charakter interpretace. Extrakce parametrů pro výzkum interpretačního výkonu je jedno z komplikovaných témat stojící na pomezí oblastí analýzy interpretačního výkonu a získávání informací z hudby. Předložená práce shrnuje poznatky a metody z obou oblastí. Pro výzkum byla vytvořena databáze, která obsahuje 31 nahrávek jedinečných interpretací 2. věty Lento Smyčcového kvartetu č. 12 F dur (1893) českého romantického skladatele Antonína Dvořáka (1841–1904).
Systémy pro určení rytmických struktur v hudebních nahrávkách
Staňková, Karolína ; Miklánek, Štěpán (oponent) ; Ištvánek, Matěj (vedoucí práce)
Tato diplomová práce se zabývá systémy pro detekci rytmických struktur hudebních nahrávek. Obor získávání informací z hudby (MIR) umožňuje zkoumat harmonické a tonální vlastnosti hudby, rytmus, tempo apod., a využívá se v akademické i komerční sféře. V oblasti detekce rytmických struktur se využívají různé algoritmy, nicméně dnes většina nových metod využívá neuronové sítě. Cílem této práce je shrnout dosavadní výsledky výzkumů systémů pro detekci hudebních dob a tempa v oboru MIR, popsat způsoby výpočtu a vyhodnocení parametrů hudebních nahrávek, a implementovat program, který umožní srovnání dostupných detekčních systémů. Výsledkem práce je program v jazyce Python, který využívá k detekci rytmické struktury testovacích nahrávek šest různých systémů. Výstupy algoritmů následně kontroluje podle zadané reference a pomocí několika hodnotících veličin dané systémy porovnává mezi sebou. K tomu využívá dvou databází hudebních nahrávek, jedné větší převzaté a jedné menší vytvořené v rámci této práce (včetně anotací, tedy referenčních časů dob pro jednotlivé nahrávky). Program též umožňuje zobrazení výsledků v grafech a přehrání libovolné nahrávky doplněné o stopu obsahující detekované časy dob.
Audio signal modelling using neural networks
Pešán, Michele ; Ištvánek, Matěj (oponent) ; Miklánek, Štěpán (vedoucí práce)
Neural networks based upon the WaveNet architecture and recurrent neural networks are nowadays used in human speech synthesis and other various tasks such as "black-box" modeling systems for acoustic signals alteration (modulation effects, non-linear distortion units, etc.). This work aims, to sum up existing methods of neural network use in acoustic signal modeling. Next, the student is to implement chosen model of neuron network Python and will train this architecture to perform a simulation of desirable sound effect or acoustic alteration system. The task for this semester is, to sum up existing knowledge concerning neural networks. Training database of sound samples and implementation of a sound modeling neural net is to be created as well. Through recent years, neural networks have been used more and more extensively across many science fields. Neural networks based upon the WaveNet architecture and recurrent neural networks are nowadays used in human speech synthesis and other various tasks such as "black-box" modeling systems for acoustic signals alteration (modulation effects, non-linear distortion units, etc.). This academic work provides a brief introduction to the neural network terminology and common practice, elaborates on several types of neural network types, the main focus on DeepMind's WaveNet. Furthermore describes and compares results of experimental implementation of WaveNet and other types of neural network in audio signal "black-box" modeling tasks.
Nástroj pro simultánní přehrávání více interpretací jedné skladby
Švejcar, Michael ; Ištvánek, Matěj (oponent) ; Miklánek, Štěpán (vedoucí práce)
Cílem této bakalářské práce bylo vytvoření programu umožňujícího simultánní přehrávání více interpretací jedné skladby a plynulého přepínání mezi nimi. K těmto účelům byl použit App Designer v prostředí MATLAB, jenž je určen k vývoji aplikací s grafickým uživatelským rozhraním. Pro vývoj aplikace bylo klíčové zejména použití dostupných toolboxů spolu s algoritmy pro výpočet víceúrovňového dynamického borcení časové osy. Výsledný přehrávač IntSwitcher umožňuje uživateli načíst dvě nahrávky interpretací jedné skladby. Ze vstupních souborů jsou nejprve vypočteny chromagramy, které jednotlivé nahrávky charakterizují z hlediska tónového vývoje v čase. Následně je na chromagramy aplikována metoda víceúrovňového dynamického borcení časové osy, jejímž výstupem je optimální cesta. Jedná se o matici, ve které jsou k sobě přiřazeny hudebně korespondující vzorky načtených audio souborů s rozlišením 50 ms. Dle této závislosti je během přehrávání určována korespondující časová pozice aktuálně neaktivní stopy, společně s pozicí jejího posuvníku. V případě přepnutí přehrávané nahrávky tedy začne druhá stopa hrát ve stejné části skladby, i pokud se tato část nachází v rozdílných časech jednotlivých nahrávek. Výsledná aplikace se jeví jako užitečný nástroj ke studování rozdílů mezi různými interpretacemi stejného hudebního díla.
Automatická klasifikace obrazů
Ševčík, Zdeněk ; Miklánek, Štěpán (oponent) ; Sikora, Pavel (vedoucí práce)
Cílem této práce je prozkoumat shlukovací algoritmy strojového učení bez učitele, které lze použít pro klasifikaci databáze obrazů podle podobnosti. Pro vybrané shlukovací algoritmy je sepsán teoretický základ. Pro zlepšení klasifikace použité databáze se diplomová práce zabývá různými metodami předzpracování obrazů. Těmito metodami jsou z obrazu extrahovány příznaky. Dále práce řeší implementaci metod předzpracování a praktickou aplikaci shlukovacích algoritmů. V praktické části je naprogramována aplikace v programovacím jazyce Python, která klasifikuje databázi obrazů do tříd podle podobnosti. Diplomová práce testuje všechny použité metody a ke konci práce je zpracována rešerše výsledků.
Určení místa původu hudebních interpretací české komorní a orchestrální hudby za pomoci technik Music Information Retrieval
Miklánek, Štěpán ; Mekyska, Jiří (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato práce se zabývá statistickou analýzou nahrávek české komorní a orchestrální hudby. Významná část této práce je věnována problematice extrakce parametrů z nahrávek. V rámci extrakce parametrů jsou využity techniky zpracování hudebního signálu používané v oblasti Music Information Retrieval. Dále jsou v práci představeny kroky při zpracovávání databází nahrávek a výběru stejných notových úseků z jednotlivých interpretací skladeb pomocí dynamického borcení časové osy. Pro účely výběru stejného notového úseků z interpretací byl naprogramován nástroj v prostředí MATLAB. V neposlední řadě je představen vyhodnocovací systém, pomocí kterého je prováděna klasifikace nahrávek podle místa původu. Samotná klasifikace je provedena v podobě binárního rozdělení na dvě skupiny Česko a svět. První část vyhodnocení spočívá v individuální analýze jednotlivých statistických parametrů, přičemž je hodnocena jejich diskriminační síla. Druhá část vyhodnocení spočívá v selekci skupin parametrů, které by měly zvýšit přesnost klasifikace oproti individuální analýze parametrů.
Porovnávání zvukových nahrávek za pomoci parametrů popisující barvu zvuku
Miklánek, Štěpán ; Schimmel, Jiří (oponent) ; Kiska, Tomáš (vedoucí práce)
Tato práce se zabývá výzkumem parametrů popisující nahrávky na základě barvy zvuku. Nejprve je popsán historický vývoj a novodobý přístup v oblasti Music Information Retrieval (MIR), poté je popsán postup při zpracovávání hudebního signálu a daná problematika je nastíněna jak z pohledu hudební teorie, tak z pohledu číslicového zpracování signálu. Následuje popis předzpracování signálu, tato část je důležitá z hlediska parametrizace hudebního signálu. V kapitole parametrizace jsou shrnuty poznatky o parametrech, které jsou běžně využívány při získávání informací z nahrávek, přičemž je kladen důraz zejména na parametry týkající se barvy zvuku. Je také představena databáze nahrávek k analýze a návrh vyhodnocovacího systému, který bude nahrávky analyzovat. Nakonec je představena individuální analýza parametrů, kterými jsou popisovány nahrávky na základě barvy zvuku.

Národní úložiště šedé literatury : Nalezeno 32 záznamů.   začátekpředchozí23 - 32  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.