Národní úložiště šedé literatury Nalezeno 72 záznamů.  začátekpředchozí41 - 50dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Extrakce melodie pomocí hlubokého učení
Balhar, Jiří ; Hajič, Jan (vedoucí práce) ; Maršík, Ladislav (oponent)
Extrakce melodie patří mezi nejdůležitější a nejtěžší úlohy oboru Music Information Retrieval, právě melodie je totiž tím hlavním, co si člověk po poslechu skladby odnáší a z podstaty se tedy často jedná o její nejvýraznější rys. Přítomnost hudebního dopro- vodu, který melodii podbarvuje, však pro algoritmické metody znemožňuje její průběh spolehlivě zachytit. V posledních letech se proto obor posouvá směrem k využívání metod hlubokého učení, které jsou schopny dřívější pravidlové systémy překonat. Na tyto práce navazujeme, představujeme tři nové metody a experimentálně ověřujeme volby, které jsme při jejich návrhu učinili. Ukazujeme, že nová architektura Harmonic Convolutional Neural Network, založená na úpravě vnitřního uspořádání obvyklé konvoluční sítě, díky které je schopna lépe zachytit harmonickou povahu jednotlivých tónů ze vstupních spektrogramů s logaritmickou osou frekvence, překonává state-of-the-art metody pro extrakci melodie na většině veřejně dostupných datasetech. 1
Feature Evaluation for Scalable Cover Song Identification Using Machine Learning
Martišek, Petr ; Maršík, Ladislav (vedoucí práce) ; Hajič, Jan (oponent)
Rozpoznávání cover verzí písní je oblast problematiky získávání informací z hudby, která se zabývá úkolem rozpoznat, zda dvě odlišné audio nahrávky obsahují různé verze téže písně. Jelikož cover verze se mohou lišit v tempu, tónině, instrumentaci a dalších vlastnostech, bylo během uplynulých let vytvořeno mnoho důmyslných příznaků vhodných pro tento účel. Pro- vedli jsme důkladnou analýzu 32 příznaků použitých v pracech zabývajících se touto problematikou, přičemž rozlišujeme příznaky přesné a škálovatelné. Přesné příznaky jsou založeny na sekvencích harmonických deskriptorů (ty- picky jsou to tzv. " chroma" vektory) a vedou k lepším výsledkům, avšak za cenu vyšší výpočetní náročnosti. Škálovatelné příznaky mají malou kon- stantní velikost a zachycují pouze obecné rysy dané audio nahrávky, díky čemuž je jejich výpočet rychlý a hodí se tak pro použití s velkými data- sety. Vybrali jsme 7 škálovatelných a 3 přesné příznaky, které jsme použili pro konstrukci našeho dvouúrovňového systému pro rozpoznávání cover verzí, přičemž škálovatelné příznaky jsou použity na první úrovni k prořezání data- setu a přesné na druhé úrovní pro zpřesnění výsledků. Dva...
Neural Network Based Named Entity Recognition
Straková, Jana ; Hajič, Jan (vedoucí práce) ; Černocký, Jan (oponent) ; Konopík, Miloslav (oponent)
Název práce: Rozpoznávání pojmenovaných entit pomocí neuronových sítí Autor: Jana Straková Ústav: Ústav formální a aplikované lingvistiky Vedoucí doktorské práce: prof. RNDr. Jan Hajič, Dr., Ústav formální a apliko- vané lingvistiky Abstrakt: Obor rozpoznávání pojmenovaných entit v češtině (tj. úkol auto- maticky identifikovat a klasifikovat významné části textu, jako například jména lidí, míst a organizací) se významně rozvinul po vydání českého korpusu poj- menovaných entit, Czech Named Entity Corpus (CNEC). Tato doktorská práce předkládá autorské výsledky v oblasti rozpoznávání pojmenovaných entit, ze- jména v češtině. Publikuje práci a výzkum provedený v průběhu přípravy CNEC a později během jeho evaluace. Dále shrnuje autorské výsledky, které před- stavují nejlepší známé výsledky v rozpoznávání českých pojmenovaných entit. Na základě jednoduché neuronové sítě s výstupní funkcí softmax a standardní sadou klasifikačních rysů je popsána metodologie a výsledky, ze kterých později vznikl otevřený software pro rozpoznávání pojmenovaných entit, NameTag. Dok- torská práce je zakončena popisem rozpoznávače založeném na rekurentních neu- ronových sítích s embeddingy slov a embeddingy založenými na znacích, které představují výsledky současného výzkumu v oblasti neuronových sítí. Rozpozná- vač nevyžaduje tvorbu...
Generování polyfonní hudby pomocí neurových sítí
Židek, Marek ; Hajič, Jan (vedoucí práce) ; Maršík, Ladislav (oponent)
Cílem této práce je prozkoumat nové možnosti v generovaní unikátních polyfonních skladeb s použitím neuronových sítí. Generovaní hudby, ať už pomocí zvukových vln nebo diskrétních reprezentací je velmi zajimvé a v posledních letech zkoumané téma. Tato práce používá jako trénovací data klasickou polyfonní hudbu reprezentovanou ve formátu midi. Nejdříve v práci popíšeme problém, předvedeme relevantní architektury neuronových sítí a poté vysvětlíme naše nápady, ze kterých jeden, a to náš experiment se třemi verzemi přidávání "skip-connections" do modelu LSTM pro generaci hudby, považujeme za kvalitní příbytek do tohoto odvětví. U podobných prací byly "skip-connections" úspěšně zkoumány hlavně pro problémy klasifikace, nicméně naše výsledky ukazují slušné vyledky pro generaci hudby (např. 47% našich respondentů považovalo naše generované vzorky za realné). Kromě standartní automatizované evaluace na testovacích datech, která je pro generování hudby hůře uchopitelná, je v práci provedena velmi komplexní evaluace pomocí dotazníků. Tato evaluace byla navržena ne pouze pro předvedení výsledků naší práce, ale také pro odhalení zajimavých souvislostí o očekávání, předsudků a charakteristik respondentů. Toto považujeme za hodnotný zdroj informací pro budoucí práce o automatickém generování hudby.
Komponování hudby pomocí programovacího jazyka
Pavlín, Tomáš ; Maršík, Ladislav (vedoucí práce) ; Hajič, Jan (oponent)
Komponování hudby pomocí počítače přináší mnoho problémů a dá se zrea- lizovat mnoha různými postupy. Existující programy na skládání hudby nedávají příliš volnosti skladatelům nebo jsou příliš komplikované pro uživatele bez tech- nického zázemí. V této práci přicházíme s intuitivním programovacím jazykem navrženým pro komponování hudby. Přikládáme také interpret tohoto jazyka, který je reprezentovaný přehledným grafickým uživatelským rozhraním umožňu- jícím komponovat a produkovat hudbu i uživateli bez technického či hudebního zaměření. Program přináší nový postup, kterým mohou skladatelé komponovat hudbu, umožňuje snadné vytváření hudby například do her a dá se využít k do- provodu ke zpěvu. 1
Vícejazyčná databáze kolokací
Helcl, Jindřich ; Hajič, Jan (vedoucí práce) ; Mareček, David (oponent)
Kolokace jsou skupiny slov, které se v daném jazyce vyskytují častěji spolu, nežli odděleně. Patří mezi ně také spojení, která dávají několika nezávislým slovům nový význam. Tato práce se zabývá nalezením kolokací v objemných datech a vytvořením databáze sloužící k jejich vyhledávání. Pro nalezení kolokací v textu počítáme hodnotu Pointwise Mutual Information založenou na počtu výskytů jednotlivých skupin slov v korpusu. Slova s nejvyšší hodnotou PMI jsou kandidáty na vhodné kolokace. Vybrané kolokace jsou uložené do databáze ve formátu použitelném pro vyhledávání pomocí Apache Lucene. Součástí práce je k vytvořené databázi přidat webové rozhraní, které umožňuje rychlý a jednoduchý způsob pro vyhledávání kolokací. Pokud by tato služba byla dostatečně rychlá a kolokace kvalitní, mohli by ji používat překladatelé k nacházení vhodných ekvivalentů v cílovém jazyce. Také může být používána studenty cizího jazyka k rozšiřování slovní zásoby. Taková databáze bude tvořena nezávisle v několika jazycích, mezi nimiž bude minimálně Čeština a Angličtina. Powered by TCPDF (www.tcpdf.org)
Matching Images to Texts
Hajič, Jan ; Pecina, Pavel (vedoucí práce) ; Průša, Daniel (oponent)
Vytváříme společný pravděpodobnostní model textu a obrázků pro úlohu automatického přiřazování ilustračních fotografií k novinovým článkům. Přistupujeme k úloze z hlediska učení reprezentací: chceme nalézt společnou reprezentaci textu i obrázků nezávislou na vlastnostech jednotlivých modalit, podobně jako multimodální hluboký Boltzmannův stroj Srivastavy a Salakhutdinova. Vstupní obrázky reprezentujeme pomocí předposlední vrstvy konvoluční neuronové sítě Krizhevského a kol., state-of-the-art reprezentace obrázků na základě jejich obsahu. Vytvořili jsme knihovnu Safire pro hluboké učení a správu multimodálních experimentů. Úspěšný vyhledávací systém se nám vyvinout nepodařilo, kvůli obtížnému trénování neuronových sítí na velmi řídkých textových datech. Porozuměli jsme však povaze těchto potíží tak, že věříme, že v navazující práci můžeme lepších výsledků dosáhnout.
Popularita osob automaticky
Hajič, Jan ; Bojar, Ondřej (vedoucí práce) ; Popel, Martin (oponent)
Možnost automaticky sledovat popularitu osob v~novinách by jistě uvítaly nejen tyto osoby samotné. Počítačové zpracovávání subjektivity je sice rychle se rozvíjející podobor komputační lingvistiky, v~češtině ovšem vůbec pro analýzu subjektivity a polarity v publicistice neexistují data. Začali jsme tedy s~tvorbou ručně anotovaného korpusu polarity z~českých publicistických textů, které se ovšem pro takové zpracování ukázaly jako krajně nevhodné. Dále jsme navrhli klasifikátor založený na statistických metodách, který by měl na základě tohoto korpusu popularitu sledovat, a otestovali jsme ho na korpusu recenzí bílého zboží a orientačně na zárodku našeho korpusu vět z~novinových článků. Jako model jsme použili automaticky extrahovaný unigramový slovník, tři příbuzné metody pro zjišťování polárních lemmat a množství filtrů pro selekci relevantních lemmat. Na recenzích bílého zboží jsme dosáhli výsledků srovnatelných se světovým výzkumem už se základním modelem, naopak u českých publicistických textů vidíme kvůli jejich charakteru možný příslib až u více lingvisticky orientovaných metod.
New Methods in Statistical Speech Recognition
Klusáček, David ; Hajič, Jan (vedoucí práce) ; Psutka, Josef (oponent) ; Černocký, Jan (oponent)
Název Práce: Nové metody ve statistickém rozpoznávání řeči Autor: David Klusáček Katedra: Ústav formální a aplikované lingvistiky, MFF UK Školitel: Prof. RNDr. Jan Hajič, Dr., ÚFAL. Abstrakt: Tato práce se pokouší identifikovat limity současných rozpoznávačů řeči a navrhnout metody jak jejich omezení překonat. Po historickém úvodu a popisu současného stavu je jako nejslabší článek řetězu prohlášen akustický front-end, zejména jeho činnost za zhoršených zvukových podmínek. Navrho- vané řešení, tzv. NUFIBA front-end, zahrnuje kompenzaci ozvěny, segmentaci zvuku na řečníka a pozadí, a průběžné sledování SNR, které v součinnosti s akustickým modelem zabraňuje lavinovému šíření chyb. Z důvodu nedostatku času jiz bohužel nedošlo k implementaci celého rozpoznávače řeči (i když ně- které části byly značně rozpracovány, například jazykový model založený na MMI třídách). Nové myšlenky tak byly vyzkoušeny pouze v jednodušším roz- poznávači fonémů. Klíčová slova: Automatické rozpoznávání řeči, souvislá řeč, NUFIBA front- end, Jazykový model, Sluchová dráha, MMI, Shlukování, Slepá dekonvoluce, Časové a frekvenční maskování, Potlačení ozvěny, Rozpoznávání fonémů.

Národní úložiště šedé literatury : Nalezeno 72 záznamů.   začátekpředchozí41 - 50dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
2 Hajič, Jakub
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.