Národní úložiště šedé literatury Nalezeno 70 záznamů.  začátekpředchozí31 - 40dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Music Visualization in 3D
Vincena, Petr ; Rittig, Tobias (vedoucí práce) ; Hajič, Jan (oponent)
Hudba je důležitou součástí našich životů a rozpoznávání emocí v hudbě je perspektiv- ním oborem s aplikací v každodenním životě. V naší práci jsme se zaměřili na rozpoznání klíčových vlastností v hudbě a následně na vytvoření systému pro detekci emocí. Rozší- řili jsme předchozí práci Huna a kol. [2009] a vytvořili dopřednou neuronovou síť, která predikuje emoce pro použití ve vizualizaci. Získali jsme výsledky srovnatelné s předchozí prací a rozebrali jejich dopad a použití. Vytvořili jsme C# projekt pro rozpoznání hu- debních vlastností, který lze použít na platformě Unity. Zároveň jsme v Unity vytvořili ukázkovou scénu, která některé z těchto vlastností vizualizuje. 1
Automatické rozpoznávání hudební notace ze zvukových dat
Čermák, Marek ; Lokoč, Jakub (vedoucí práce) ; Hajič, Jan (oponent)
Název práce: Automatické rozpoznávání hudební notace ze zvukových dat Autor: Marek Čermák Katedra / Ústav: Katedra softwarového inženýrství Vedoucí bakalářské práce: doc. RNDr. Jakub Lokoč, Ph.D. Abstrakt: Cílem této práce je návrh a implementace aplikace využívající konvoluční neuronové sítě k tvorbě hudební notace ze zvukových dat. Aplikace je schopná učit neuronovou síť pomocí vstupních souborů ve formátu MIDI (Musical Instrument Digital Interface) a spárovat jednotlivé úseky hudby s jejich zvukovou podobou. Učení neuronové sítě může probíhat na uživatelem specifikované kolekci souborů MIDI či na náhodně generované hudbě. Každému nástroji ve standardu MIDI může být přiřazena síť, jejímž výstupem jsou přehrávané noty v daném časovém úseku. Postupným procházením zvukových dat generuje síť úseky aktivních not, které jsou následně spojeny do výsledného souboru. Součástí aplikace je také rozpoznávání slov ze zvuku pomocí externí služby. Klíčová slova: hudební notace, neuronová síť, hluboké učení, rozpoznání zvuku, MIDI
Efficient neural speech synthesis
Vainer, Jan ; Dušek, Ondřej (vedoucí práce) ; Hajič, Jan (oponent)
Modely pro práci se sekvenčními daty založené na neuronových sítích v posledních letech výrazně přispěly ke zlepšení kvality systémů pro syntézu řeči. Zatím však nebyl navržen systém, který by se dal rychle a efektivně natrénovat, byl schopen rychlé syntézy a zároveň generoval hlas ve vysoké kvalitě. V této diplomové práci představujeme systém pro syntézu řeči založený na neuronových sítích, který je schopen generovat spektrogramy v reálném čase, má nízké nároky na výpočetní kapacity a je rychle trénovatelný. Náš systém sestává ze dvou neuronových sítí- ze studenta a z učitele. Učitel je využit k aproximaci zarovnání mezi textem, z něhož má být generována mluvená řeč, a mezi korespondujícím spektrogramem. Student využívá získaná zarovnání pro efektivní syntézu spektrogramů z fonet- ické reprezentace vstupního textu. Obě sítě využívají jednoduché konvoluční vrstvy. Náš systém trénujeme na anglické datové sadě LJSpeech. Systém je schopen generovat řeč v reálném čase na běžném procesoru a je možné jej rychle natrénovat na jedné graické kartě. Kvalita řeči generované z našeho systému byla ohodnocena jako signifikantně vyšší v porovnání s konkurenčními systémy. 1
Optical Music Recognition using Deep Neural Networks
Mayer, Jiří ; Pecina, Pavel (vedoucí práce) ; Hajič, Jan (oponent)
Automatický přepis notových zápisů (Optical Music Recognition) je zajímavá úloha, v mnoha ohledech podobná automatickému přepisu textu (Optical Character Recognition). Přináší s sebou ovšem mnoho problémů, které způsobují potíže klasickým metodám počí- tačového vidění. Hluboké neuronové sítě umožnily řešit automatický přepis textu tzv. end-to-end přístupem, kdy se celá úloha řeší najednou. Zkusili jsme použít tuto metodu na problém rozpoznávání notových zápisů, ale zaměřili jsme se pouze na ručně psané zápisy. Pro vyřešení nedostatku trénovacích dat jsme vyvinuli sázecí systém s názvem Mashcima. Tento systém úspěšně napodobuje vzhled datasetu CVC-MUSCIMA. Provedli jsme vyhodnocení našeho přístupu na části datasetu CVC-MUSCIMA s velmi nadějnými výsledky, což naznačuje, že použité řešení je funkční a další práce v tomto směru by mohla vést ještě k dalšímu zlepšení. 1
Controlled Music Generation with Deep Learning
Židek, Marek ; Hajič, Jan (vedoucí práce) ; Matzner, Filip (oponent)
Generování hudby je jedna z nejtežších úloh pro umělou inteligenci. Přístupy založené na strojovém učení již dokázaly přesvědčivě napodobovat skladatelskou práci na kratších hudebních úsecích, nicméně většina současných přístupů nedokáže vytvořit delší koherentní skladby. Tato práce chce ukázat, jak můžeme ovládat modely hlubokého učení z vnějšku, abychom docílili dlouhodobé koherence vygenerovaných skladeb s více hlasy. Pracujeme s klasickou hudbou s instrumentací od klavíru, přes smyčcový kvartet až po symfonické skladby. Ovladatelnost generovacího procesu spočívá ve využívaní hudební formy, která je v abstraktním slova smyslu obecným popisem pro podobnosti a nepodobnosti hudebních pasáží a jejich rozložení ve skladbě. Pro dosáhnutí této ovladatelnosti, (1) navrhujeme pseudometriku pro porovnávání hudení podobností s pomocí již existujících metod, (2) extrahujeme hudbení formu z trénovacích dat pomocí shlukovacího algoritmu nad podobnostními hodnotami, (3) trénujeme tři modely, které generují podobné, nepodobné a lokálně koherentní hudební fragmenty, a (4) navrhujeme způsob, jak využívat extrahované hudební formy společně se třemi modely pro generování delších koherentních skladeb z hudebních fragmentů. Ukazujeme, jak si v generování hudebních fragmentů vedou modely "transformer", když jim předkládáme...
Optical Recognition of Handwritten Music Notation
Hajič, Jan ; Pecina, Pavel (vedoucí práce) ; Fujinaga, Ichiro (oponent) ; Černocký, Jan (oponent)
Rozpoznávání notopisu (Optical Music Recognition, OMR) je obor studující jak automaticky číst hudební notaci. Tato disertace prezentuje formou souboru publikovaných prací příspěvky k teorii, infrastruktuře a metodám OMR především pro ručně psanou notaci. Hlavními přínosy jsou (1) formální popis hudební notace pomocí notačního grafu (Music Notation Graph, MuNG), orientovaného grafu, ze kterého lze jednoznačně odvodit v notaci zakódovanou hudební sémantiku, (2) datová sada MUSCIMA++ hudebních rukopisů, které jsou anotovány pomocí MuNG, a lze ji tak využít pro trénování a evaluování libovolných systémů a podsystémů OMR, včetně extrakce hudební sémantiky a (3) systém rozpoznávání notopisu extrahující hudební sémantické informace z rukopisů, který používá strojové učení jak pro detekci notačních objektů, tak pro jejich usouvstažňování, a na základě takto automaticky vytvořené reprezentace pomocí MuNG deterministicky dopočítává sémantiku. Ačkoliv tento OMR systém stále dělá množství chyb, jedná se o první systém, který hudební rukopisy rozpoznává tak, že lze jeho výsledky využít na některé z úloh motivujících práci na OMR, a zpracovává libovolně komplikovanou notaci.
Automatický expresivní čtený projev
Výkruta, Jan ; Hajič, Jan (vedoucí práce) ; Libovický, Jindřich (oponent)
Expresivní čtení je jedním ze způsobů verbálního projevu. Obvykle bývá čte- ným textem próza nebo poezie. Zatím málo prací se zabývalo tím, co ovlivňuje expresivitu a jestli se dá vygenerovat pomocí počítače. LibriSpeech je velkým korpusem čtené prózy a poezie, a umožňuje nám otestovat generování expre- sivního čtení pomocí metod strojového učení. Soustředili jsme se na poezii, neboť obvykle vyžaduje větší expresivitu. Implementovali jsme metody, které mohu být využity k natrénování dalších modelů i k vytvoření nových dat, která mohou být použita v našich metodách na trénování. Dále jsme vytvořili roz- šiřitelnou aplikaci, která dostane báseň, předpoví její expresivní čtení a toto čtení vizualizuje. Navíc ještě přehraje audio nahrávku vygenerovanou pomocí Text-To-Speech systému. 1
Využití syntaktické informace pro identifikaci hodnocených entit
Glončák, Vladan ; Hajič, Jan (vedoucí práce) ; Helcl, Jindřich (oponent)
Identifikace hodnocených entit (Opinion Target Extraction, OTE) je zavedená pod-úloha analýzy sentimentu. Zatímco detekce subjektivních výroků a určení jejich polarity (pozitivní, nebo negativní) je samo o sobě užitečné, schopnost identifikovat i tyto "cílové" entity poskytuje mnohem kvalitnější podklady pro rozhodování: majitelka restaurace potřebuje vědět, jestli si hosté stěžují na obsluhu, jídlo, atmosféru, či další aspekty jejího podniku, atp. Ačkoliv tato úloha má stále silnou lexikální složku, je zde i velký potenciál využít obecných syntaktických konstrukcí v evaluativních výrocích: v jedné větě například může být potenciálních cílových entit více, a přiřazení správného cíle k hodnotícímu výroku tak je záležitostí správného rozlišení v syntaktické struktuře věty. Syntaktické vzorce spojené s evlauativními výroky již byly popsány. Tato diplomová práce si klade za cíl zkoumat, jak přítomnost syntaktické informace ovlivňuje na úloze extrakce cílových entit (OTE) chování state-of-the-art modelů strojového učení, jako například rekurentních neuronových sítí. Nepodařilo se nám najít žádné přesvědčivé důkazy, které by nasvědčovaly, že přítomnost syntaktické informace výrazně ovlivňuje chování zvolených modelů.
Extrakce melodie pomocí hlubokého učení
Balhar, Jiří ; Hajič, Jan (vedoucí práce) ; Maršík, Ladislav (oponent)
Extrakce melodie patří mezi nejdůležitější a nejtěžší úlohy oboru Music Information Retrieval, právě melodie je totiž tím hlavním, co si člověk po poslechu skladby odnáší a z podstaty se tedy často jedná o její nejvýraznější rys. Přítomnost hudebního dopro- vodu, který melodii podbarvuje, však pro algoritmické metody znemožňuje její průběh spolehlivě zachytit. V posledních letech se proto obor posouvá směrem k využívání metod hlubokého učení, které jsou schopny dřívější pravidlové systémy překonat. Na tyto práce navazujeme, představujeme tři nové metody a experimentálně ověřujeme volby, které jsme při jejich návrhu učinili. Ukazujeme, že nová architektura Harmonic Convolutional Neural Network, založená na úpravě vnitřního uspořádání obvyklé konvoluční sítě, díky které je schopna lépe zachytit harmonickou povahu jednotlivých tónů ze vstupních spektrogramů s logaritmickou osou frekvence, překonává state-of-the-art metody pro extrakci melodie na většině veřejně dostupných datasetech. 1
Feature Evaluation for Scalable Cover Song Identification Using Machine Learning
Martišek, Petr ; Maršík, Ladislav (vedoucí práce) ; Hajič, Jan (oponent)
Rozpoznávání cover verzí písní je oblast problematiky získávání informací z hudby, která se zabývá úkolem rozpoznat, zda dvě odlišné audio nahrávky obsahují různé verze téže písně. Jelikož cover verze se mohou lišit v tempu, tónině, instrumentaci a dalších vlastnostech, bylo během uplynulých let vytvořeno mnoho důmyslných příznaků vhodných pro tento účel. Pro- vedli jsme důkladnou analýzu 32 příznaků použitých v pracech zabývajících se touto problematikou, přičemž rozlišujeme příznaky přesné a škálovatelné. Přesné příznaky jsou založeny na sekvencích harmonických deskriptorů (ty- picky jsou to tzv. " chroma" vektory) a vedou k lepším výsledkům, avšak za cenu vyšší výpočetní náročnosti. Škálovatelné příznaky mají malou kon- stantní velikost a zachycují pouze obecné rysy dané audio nahrávky, díky čemuž je jejich výpočet rychlý a hodí se tak pro použití s velkými data- sety. Vybrali jsme 7 škálovatelných a 3 přesné příznaky, které jsme použili pro konstrukci našeho dvouúrovňového systému pro rozpoznávání cover verzí, přičemž škálovatelné příznaky jsou použity na první úrovni k prořezání data- setu a přesné na druhé úrovní pro zpřesnění výsledků. Dva...

Národní úložiště šedé literatury : Nalezeno 70 záznamů.   začátekpředchozí31 - 40dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
2 Hajič, Jakub
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.