Národní úložiště šedé literatury Nalezeno 78 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Generování hudebních symbolů pomocí neuronových sítí
Havelka, Jonáš ; Pecina, Pavel (vedoucí práce) ; Hajič, Jan (oponent)
Vytvořili jsme více trénovacích dat pro optické rozpoznávání notových zápisů (OMR) pomocí vygenerování umělých obrázků hudebních symbolů. V návaznosti na Mashcimu a model, který nad ní J. Mayer natrénoval, jsme vzali Rebelo dataset (dataset obrázků hudebních symbolů), upravili ho metodami počítačového vidění a natrénovali na něm generativní neuronové sítě (především variační a adversariální autoenkodéry). Nahrazením části původních obrázků v Mashcimě obrázky vygenerova- nými těmito sítěmi jsme dosáhli lepšího výkonu modelu: Za mírné zhoršení na původním datasetu (CVC-MUSCIMA) jsme získali o dost lepší výsledky na datasetu PrIMuS. Taktéž jsme vytvořili velmi realistické umělé obrázky hudebních symbolů.
Semi-supervised learning in Optical Music Recognition
Mayer, Jiří ; Pecina, Pavel (vedoucí práce) ; Straka, Milan (oponent)
Optické rozpoznávání notových zápisů je úzký podobor počítačového vidění, který sice disponuje určitým množstvím anotovaných datasetů, nicméně má k dispozici řádově větší množství neanotovaných dat. Tento obor se v poslední době vyvíjí zejména díky aplikaci hlubokého učení, ale na trénování neuronových sítí se zatím používají pouze anotovaná data. Semi-supervised learning je podoblast strojového učení, zbývající se sou- časným učením z anotovaných a neanotovaných dat. Cílem je získat lepší modely, než kdybychom trénovali pouze z anotovaných dat. V této práci jsme upravili existující ar- chitekturu, používanou pro detekci hudebních symbolů, a navrhli jsme způsob, jakým ji trénovat v semi-supervised režimu. Upravená architektura je schopná učit se reprezentace i z neanotovaných dat a ve srovnání se svojí původní variantou má stabilnější trénování. 1
Automatické vytváření slovníků z paralelních korpusů
Popelka, Jan ; Pecina, Pavel (vedoucí práce) ; Mareček, David (oponent)
V rámci práce implementujeme vlastní systém pro zarovnání slov v paralelním korpusu. Použitá diskriminativní metoda zarovnání využívá lexikálních asociačních měr a dalších příznaků a vyžaduje malé množství ručně anotovaných trénovacích dat pro optimalizaci parametrů modelu. Optimální zarovnání je nalezeno jako nejlevnější hranové pokrytí v ohodnoceném bipartitním grafu, na základě vybraných suboptimálních zarovnání je rozlišena věrohodnost spojů. Použitá kombinace příznaků je experimentálně vyladěna s ohledem na dosažení optimálních výsledků. Výsledky zarovnání jsou vyhodnoceny a porovnány se systémem GIZA++. Nejlepší natrénovaný model je využit pro zarovnání česko-anglického paralelního korpusu Czeng 0.9. Na základě nejvěrohodnějších spojů je z korpusu extrahován ohodnocený překladový lexikon jednoslovných výrazů. Překladové dvojice jsou seřazeny podle významnosti a je provedeno automatické vyhodnocení přesnosti pro různé velikosti slovníků. Pro tři vybrané velikosti slovníku je vyhodnocení provedeno ručně.
Sumarizace textu
Majliš, Martin ; Pecina, Pavel (vedoucí práce) ; Schlesinger, Pavel (oponent)
V předložené práci jsou vysvětleny základní principy automatické sumarizace, evaluace a základními pojmy, které se v této oblasti používají. Dále obsahuje popis implementace systém pro automatickou sumarizace a evaluaci textů - CsummaK (Czech Summarization Kit). Součástí tohoto systému jsou základní algoritmy pro tvorbu extrakt a jejich evaluaci, jejichž popis je také součástí této práce. Tento systém byl použit pro tvorbu automatických extraktů z novinových článků. Pro získání referenčních extraktů byl vytvoen další systém, který umožňuje uživatelům on-line vytvářet extrakty novinových článků. V práci je také provedeno měření kvality jednotlivých algoritmů, jejich kombinací s různou hodnotou parametrů společně s diskuzí nad možnostmi praktického nasazení.
Pravděpodobnostní překladový slovník
Rouš, Jan ; Žabokrtský, Zdeněk (vedoucí práce) ; Pecina, Pavel (oponent)
V této práci popisujeme poloautomatickou metodu trénování pravděpodobnostního překladového slovníku z rozssáhlých automaticky anotovaných paralelních korpusů. Na základě studia překladových chyb a funkce slovníku v rámci překladového systému TectoMT obecně byly navrženy modely různé složitosti. Tyto základní modely byly zkombinovány do hierarchických modelů, jejichž účel je snížit dopad problému řídkých dat. Slovník byl doplněn o rozšíření, která jsou navržena tak, aby odstraňovala časté problémy lexikálního charakteru. Slovník spolu s rozšířeními byl na testovacích datech porovnán s původním slovníkem a výsledky ukazují, že došlo k zvýšení kvality překladu.
Automatické vytváření sémantických sítí
Kirschner, Martin ; Pecina, Pavel (vedoucí práce) ; Holub, Martin (oponent)
Předložená práce si dává za cíl prozkoumat možnosti automatické konstrukce a rozšiřování sémantických sítí za použití metod strojového učení. Důraz je kladen na postup získávání rysů pro sadu dat. Práce prezentuje robustní metodu získávání sémantických relací, založenou na distribuční hypotéze a trénovanou na datech z Czech WordNetu. Dále jsou prezentovány zatím první výsledky pro český jazyk v této oblasti. Součástí práce je sada programů pro zpracování a vyhodnocení dat a přehled a diskuze jejich výsledků na konkrétních datech. Výsledným nástrojem je možné zpracovávat data v rozsahu v řádech stovek miliónů slov. Práce byla vypracována na českých morfologicky a syntakticky anotovaných datech, nicméně použité postupy nejsou na jazyce závislé.
Entity retrieval on Wikipedia in the scope of the gikiCLEF track
Duarte Torres, Sergio Raul ; Pecina, Pavel (vedoucí práce) ; Žabokrtský, Zdeněk (oponent)
This thesis presents a system to retrieve entities specified by a question or description given in natural language, this description indicates the entity type and the properties that the entities need to satisfy. This task is analogous to the one proposed in the GikiCLEF 2009 track. The system is fed with the Spanish Wikipedia Collection of 2008 and every entity is represented by a Wikipage. We propose three novel methods to perform query expansion in the problem of entity retrieval. We also introduce a novel method to employ the English Yago and DBpedia semantic resources to determine the target named entity type; this method is used to improve previous approaches in which the target NE type is based solely on Wikipedia categories. We show that our system obtains promising results when we evaluate its performance in the GikiCLEF 2009 topic list and compare the results with the other participants of the track.
On the Possibility of ESP Data Use in Natural Language Processing
Knopp, Tomáš ; Vidová Hladká, Barbora (vedoucí práce) ; Pecina, Pavel (oponent)
Cílem této bakalářské práce je prozkoumat databázi popisků obrázků ze hry ESP z pohledu zpracování přirozeného jazyka. ESP hra je online hra, ve které lidští hráči konají užitečnou práci - obrázky popisují. Výstupem hry ESP je pak databáze obrázků a jejich popisků. Zajímá nás, zda by data nashromážděná v průběhu získávání popisků obrázků mohla být užitečná pro úkoly zpracování přirozeného jazyka. Konkrétně máme na mysli úkol automatického určování koreferencí, rozšíření lexikální databáze WordNet, zjišťování idiomů a zjišťování slovních spojení. V této bakalářské práci se zaměříme na první dva z nich, tedy na použití databáze pro automatické určování koreferencí a na prozkoumání jejího potenciálního přínosu lexikální databázi WordNet.
Mining texts at the discourse level
Van de Moosdijk, Sara Francisca ; Pecina, Pavel (vedoucí práce) ; Novák, Michal (oponent)
Lingvistický diskurz se zabývá významem delších kusů textu, od vět po celé dokumenty, mohl by se však uplatnit i v úlohách získávání informací z textu, např. vyhledávání dokumentů či jejich sumarizace. Cílem této práce je uplatnění informací o stavbě diskurzu psaného textu pro potřeby získávání znalostí. Jedná se o prvnípokus, který se snaží skloubit tyto dva velice odlišné obory, a jeho ambicí je tak připravit základ pro tento způsob získávání znalostí. Náš postup spočívá v použití metod neřízeného strojového učení k analýze diskurzních vztahů a jejich následovném modelování pomocí vzorových struktur z formální konceptuální analýzy. Naši metodu jsme aplikovali na korpus lékařských článků z databáze PubMed. Tyto lékařské texty potom obohacujeme o koncepty z metathesauru UMLS, které jsou kombinovány s daty ze sémantické sítě UMLS, která fungují jako ontologie ve vzorových strukturách. Naše výsledky ukazují, že i přes vysokou úroveň šumu je naše metoda slibná a bylo by možné ji aplikovat i na jiné domény. Powered by TCPDF (www.tcpdf.org)
Evaluation methods of systems for unsegmented speech retrieval.
Galuščáková, Petra ; Pecina, Pavel (vedoucí práce) ; Hoffmannová, Petra (oponent)
Práca popisuje v súčasnosti používané spôsoby evaluácie vyhľadávania v hovorenej reči. Vysvetlené sú rôzne prístupy, ktoré slúžia na vyhľadávanie v hovorenej reči, ako aj spôsoby, ktoré slúžia na evaluáciu tohoto vyhľadávania. Práca sa pritom zameriava na vyhľadávanie v nahrávkach, ktoré nie sú segmentované na kratšie úseky. Cieľom práce je overiť, či sú používané spôsoby vyhľadávania adekvátne a prípadne vylepšiť tieto spôsoby evaluácie. V práci sú použité empirické prístupy založené na tom, ako užívatelia vyhľadávanie v hovorenej reči vnímajú a ako pracujú so systémami určenými na toto vyhľadávanie. Upravené spôsoby evaluácie sú nakoniec porovnané s pôvodnými technikami.

Národní úložiště šedé literatury : Nalezeno 78 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
3 Pecina, Petr
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.