Hajič, Jan - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: Hajič, Jan

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Neural Network Based Named Entity Recognition Straková, Jana ; Hajič, Jan (vedoucí práce) ; Černocký, Jan (oponent) ; Konopík, Miloslav (oponent) Název práce: Rozpoznávání pojmenovaných entit pomocí neuronových sítí Autor: Jana Straková Ústav: Ústav formální a aplikované lingvistiky Vedoucí doktorské práce: prof. RNDr. Jan Hajič, Dr., Ústav formální a apliko- vané lingvistiky Abstrakt: Obor rozpoznávání pojmenovaných entit v češtině (tj. úkol auto- maticky identifikovat a klasifikovat významné části textu, jako například jména lidí, míst a organizací) se významně rozvinul po vydání českého korpusu poj- menovaných entit, Czech Named Entity Corpus (CNEC). Tato doktorská práce předkládá autorské výsledky v oblasti rozpoznávání pojmenovaných entit, ze- jména v češtině. Publikuje práci a výzkum provedený v průběhu přípravy CNEC a později během jeho evaluace. Dále shrnuje autorské výsledky, které před- stavují nejlepší známé výsledky v rozpoznávání českých pojmenovaných entit. Na základě jednoduché neuronové sítě s výstupní funkcí softmax a standardní sadou klasifikačních rysů je popsána metodologie a výsledky, ze kterých později vznikl otevřený software pro rozpoznávání pojmenovaných entit, NameTag. Dok- torská práce je zakončena popisem rozpoznávače založeném na rekurentních neu- ronových sítích s embeddingy slov a embeddingy založenými na znacích, které představují výsledky současného výzkumu v oblasti neuronových sítí. Rozpozná- vač nevyžaduje tvorbu... Úplný záznam
	Generování polyfonní hudby pomocí neurových sítí Židek, Marek ; Hajič, Jan (vedoucí práce) ; Maršík, Ladislav (oponent) Cílem této práce je prozkoumat nové možnosti v generovaní unikátních polyfonních skladeb s použitím neuronových sítí. Generovaní hudby, ať už pomocí zvukových vln nebo diskrétních reprezentací je velmi zajimvé a v posledních letech zkoumané téma. Tato práce používá jako trénovací data klasickou polyfonní hudbu reprezentovanou ve formátu midi. Nejdříve v práci popíšeme problém, předvedeme relevantní architektury neuronových sítí a poté vysvětlíme naše nápady, ze kterých jeden, a to náš experiment se třemi verzemi přidávání "skip-connections" do modelu LSTM pro generaci hudby, považujeme za kvalitní příbytek do tohoto odvětví. U podobných prací byly "skip-connections" úspěšně zkoumány hlavně pro problémy klasifikace, nicméně naše výsledky ukazují slušné vyledky pro generaci hudby (např. 47% našich respondentů považovalo naše generované vzorky za realné). Kromě standartní automatizované evaluace na testovacích datech, která je pro generování hudby hůře uchopitelná, je v práci provedena velmi komplexní evaluace pomocí dotazníků. Tato evaluace byla navržena ne pouze pro předvedení výsledků naší práce, ale také pro odhalení zajimavých souvislostí o očekávání, předsudků a charakteristik respondentů. Toto považujeme za hodnotný zdroj informací pro budoucí práce o automatickém generování hudby. Úplný záznam
	Komponování hudby pomocí programovacího jazyka Pavlín, Tomáš ; Maršík, Ladislav (vedoucí práce) ; Hajič, Jan (oponent) Komponování hudby pomocí počítače přináší mnoho problémů a dá se zrea- lizovat mnoha různými postupy. Existující programy na skládání hudby nedávají příliš volnosti skladatelům nebo jsou příliš komplikované pro uživatele bez tech- nického zázemí. V této práci přicházíme s intuitivním programovacím jazykem navrženým pro komponování hudby. Přikládáme také interpret tohoto jazyka, který je reprezentovaný přehledným grafickým uživatelským rozhraním umožňu- jícím komponovat a produkovat hudbu i uživateli bez technického či hudebního zaměření. Program přináší nový postup, kterým mohou skladatelé komponovat hudbu, umožňuje snadné vytváření hudby například do her a dá se využít k do- provodu ke zpěvu. 1 Úplný záznam
	Vícejazyčná databáze kolokací Helcl, Jindřich ; Hajič, Jan (vedoucí práce) ; Mareček, David (oponent) Kolokace jsou skupiny slov, které se v daném jazyce vyskytují častěji spolu, nežli odděleně. Patří mezi ně také spojení, která dávají několika nezávislým slovům nový význam. Tato práce se zabývá nalezením kolokací v objemných datech a vytvořením databáze sloužící k jejich vyhledávání. Pro nalezení kolokací v textu počítáme hodnotu Pointwise Mutual Information založenou na počtu výskytů jednotlivých skupin slov v korpusu. Slova s nejvyšší hodnotou PMI jsou kandidáty na vhodné kolokace. Vybrané kolokace jsou uložené do databáze ve formátu použitelném pro vyhledávání pomocí Apache Lucene. Součástí práce je k vytvořené databázi přidat webové rozhraní, které umožňuje rychlý a jednoduchý způsob pro vyhledávání kolokací. Pokud by tato služba byla dostatečně rychlá a kolokace kvalitní, mohli by ji používat překladatelé k nacházení vhodných ekvivalentů v cílovém jazyce. Také může být používána studenty cizího jazyka k rozšiřování slovní zásoby. Taková databáze bude tvořena nezávisle v několika jazycích, mezi nimiž bude minimálně Čeština a Angličtina. Powered by TCPDF (www.tcpdf.org) Úplný záznam
	Matching Images to Texts Hajič, Jan ; Pecina, Pavel (vedoucí práce) ; Průša, Daniel (oponent) Vytváříme společný pravděpodobnostní model textu a obrázků pro úlohu automatického přiřazování ilustračních fotografií k novinovým článkům. Přistupujeme k úloze z hlediska učení reprezentací: chceme nalézt společnou reprezentaci textu i obrázků nezávislou na vlastnostech jednotlivých modalit, podobně jako multimodální hluboký Boltzmannův stroj Srivastavy a Salakhutdinova. Vstupní obrázky reprezentujeme pomocí předposlední vrstvy konvoluční neuronové sítě Krizhevského a kol., state-of-the-art reprezentace obrázků na základě jejich obsahu. Vytvořili jsme knihovnu Safire pro hluboké učení a správu multimodálních experimentů. Úspěšný vyhledávací systém se nám vyvinout nepodařilo, kvůli obtížnému trénování neuronových sítí na velmi řídkých textových datech. Porozuměli jsme však povaze těchto potíží tak, že věříme, že v navazující práci můžeme lepších výsledků dosáhnout. Úplný záznam
	Popularita osob automaticky Hajič, Jan ; Bojar, Ondřej (vedoucí práce) ; Popel, Martin (oponent) Možnost automaticky sledovat popularitu osob v~novinách by jistě uvítaly nejen tyto osoby samotné. Počítačové zpracovávání subjektivity je sice rychle se rozvíjející podobor komputační lingvistiky, v~češtině ovšem vůbec pro analýzu subjektivity a polarity v publicistice neexistují data. Začali jsme tedy s~tvorbou ručně anotovaného korpusu polarity z~českých publicistických textů, které se ovšem pro takové zpracování ukázaly jako krajně nevhodné. Dále jsme navrhli klasifikátor založený na statistických metodách, který by měl na základě tohoto korpusu popularitu sledovat, a otestovali jsme ho na korpusu recenzí bílého zboží a orientačně na zárodku našeho korpusu vět z~novinových článků. Jako model jsme použili automaticky extrahovaný unigramový slovník, tři příbuzné metody pro zjišťování polárních lemmat a množství filtrů pro selekci relevantních lemmat. Na recenzích bílého zboží jsme dosáhli výsledků srovnatelných se světovým výzkumem už se základním modelem, naopak u českých publicistických textů vidíme kvůli jejich charakteru možný příslib až u více lingvisticky orientovaných metod. Úplný záznam
	API pro ovládání robota v přirozeném jazyce Etenkowski, Bartlomiej ; Hajič, Jan (vedoucí práce) ; Jurčíček, Filip (oponent) Úplný záznam
	New Methods in Statistical Speech Recognition Klusáček, David ; Hajič, Jan (vedoucí práce) ; Psutka, Josef (oponent) ; Černocký, Jan (oponent) Název Práce: Nové metody ve statistickém rozpoznávání řeči Autor: David Klusáček Katedra: Ústav formální a aplikované lingvistiky, MFF UK Školitel: Prof. RNDr. Jan Hajič, Dr., ÚFAL. Abstrakt: Tato práce se pokouší identifikovat limity současných rozpoznávačů řeči a navrhnout metody jak jejich omezení překonat. Po historickém úvodu a popisu současného stavu je jako nejslabší článek řetězu prohlášen akustický front-end, zejména jeho činnost za zhoršených zvukových podmínek. Navrho- vané řešení, tzv. NUFIBA front-end, zahrnuje kompenzaci ozvěny, segmentaci zvuku na řečníka a pozadí, a průběžné sledování SNR, které v součinnosti s akustickým modelem zabraňuje lavinovému šíření chyb. Z důvodu nedostatku času jiz bohužel nedošlo k implementaci celého rozpoznávače řeči (i když ně- které části byly značně rozpracovány, například jazykový model založený na MMI třídách). Nové myšlenky tak byly vyzkoušeny pouze v jednodušším roz- poznávači fonémů. Klíčová slova: Automatické rozpoznávání řeči, souvislá řeč, NUFIBA front- end, Jazykový model, Sluchová dráha, MMI, Shlukování, Slepá dekonvoluce, Časové a frekvenční maskování, Potlačení ozvěny, Rozpoznávání fonémů. Úplný záznam
	Annotation of Multiword Expressions in the Prague Dependency Treebank Straňák, Pavel ; Hajič, Jan (vedoucí práce) ; Pala, Karel (oponent) ; Pecina, Pavel (oponent) This thesis explores annotation of multiword expressions in the Prague Dependency Treebank 2.0. We explain, what we understand as multiword expressions (MWEs), review the state of PDT 2.0 with respect to MWEs and present our annotation. We describe the data format developed for the annotation, the annotation tool, and other soware developed to allow for visualisation and searching of the data. We also present the annotation lexicon SemLex and analysis of the annotation. Úplný záznam
	Hloubková automatická analýza angličtiny Dušek, Ondřej ; Hajič, Jan (vedoucí práce) ; Vidová Hladká, Barbora (oponent) Tato diplomová práce popisuje studii hloubkové, tj. sémantické analýzy angličtiny, zejména na základě teoretického popisu pomocí propozic a jejich argumentové struktury. Hlavním cílem práce je vytvořit systém pro automatickou klasi kaci sémantických vztahů mezi propozicemi a jejich argumenty - značkování sémantických rolí. Vyvinuli jsme prostředí pro paralelní zpracování experimentů, přičemž jsme integrovali existující nástroje pro strojové učení a implementovali jak již popsané, tak nové postupy. Prostudovali jsme známé přístupy k tomuto problému a navrhli několik vylepšení, jako např. nové rysy pro klasi kaci, oddělené řešení pro příslovečná určení nebo zvláštní zacházení s řídkými predikáty. Na základě tohoto výzkumu jsme zkonstruovali vlastní systém pro sémantickou analýzu, který sestává z modulů pro disambiguaci predikátů a klasi kaci argumentů. Práce je zakončena testem našeho systému na anglickém korpusu určeném pro soutěž CoNLL 2009 Shared Task. Úplný záznam

Viz též: podobná jména autorů
2	Hajič, Jakub

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English