Národní úložiště šedé literatury Nalezeno 64 záznamů.  začátekpředchozí55 - 64  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Automatické určování zájmenné koreference v češtině
Košarko, Ondřej ; Mírovský, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Název práce: Automatické určování zájmenné koreference v češtině Autor: Ondřej Košarko Katedra (ústav): ÚFAL MFF UK Vedoucí bakalářské práce: RNDr. Jiří Mírovský, Ph.D. e­mail vedoucího: mirovsky@ufal.mff.cuni.cz Abstrakt: Cílem této práce je představit automatickou proceduru značkování zájmen­ né koreference v českém textu anotovaném na morfologické a analytické rovině dle systému Pražského závislostního korpusu. Procedura využívá metodu strojového učení, pro jejíž trénování jsou použita ručně anotovaná data Pražského závislostního korpusu. Součástí práce je také vyhodnocení výsledků. Klíčová slova: zájmenná koreference, automatické určování, strojové učení
Hloubková automatická analýza angličtiny
Dušek, Ondřej ; Hajič, Jan (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Tato diplomová práce popisuje studii hloubkové, tj. sémantické analýzy angličtiny, zejména na základě teoretického popisu pomocí propozic a jejich argumentové struktury. Hlavním cílem práce je vytvořit systém pro automatickou klasi kaci sémantických vztahů mezi propozicemi a jejich argumenty - značkování sémantických rolí. Vyvinuli jsme prostředí pro paralelní zpracování experimentů, přičemž jsme integrovali existující nástroje pro strojové učení a implementovali jak již popsané, tak nové postupy. Prostudovali jsme známé přístupy k tomuto problému a navrhli několik vylepšení, jako např. nové rysy pro klasi kaci, oddělené řešení pro příslovečná určení nebo zvláštní zacházení s řídkými predikáty. Na základě tohoto výzkumu jsme zkonstruovali vlastní systém pro sémantickou analýzu, který sestává z modulů pro disambiguaci predikátů a klasi kaci argumentů. Práce je zakončena testem našeho systému na anglickém korpusu určeném pro soutěž CoNLL 2009 Shared Task.
Functional Arabic Morphology: Formal System and Implementation
Smrž, Otakar ; Vidová Hladká, Barbora (vedoucí práce) ; Hajič, Jan (oponent) ; Habash, Nizar Y. (oponent)
Functional Arabic Morphology is a formulation of the Arabic inflectional system seeking the working interface between morphology and syntax. ElixirFM is its high-level implementation that reuses and extends the Functional Morphology library for Haskell. Inflection and derivation are modeled in terms of paradigms, grammatical categories, lexemes and word classes. The computation of analysis or generation is conceptually distinguished from the general-purpose linguistic model. The lexicon of ElixirFM is designed with respect to abstraction, yet is no more complicated than printed dictionaries. It is derived from the open-source Buckwalter lexicon and is enhanced with information sourcing from the syntactic annotations of the Prague Arabic Dependency Treebank. MorphoTrees is the idea of building effective and intuitive hierarchies over the information provided by computational morphological systems. MorphoTrees are implemented for Arabic as an extension to the TrEd annotation environment based on Perl. Encode Arabic libraries for Haskell and Perl serve for processing the non-trivial and multi-purpose ArabTEX notation that encodes Arabic orthographies and phonetic transcriptions in parallel.
Rozšířený HMM tagger a jeho aplikace na morfologické značkování češtiny
Kypta, Tomáš ; Mírovský, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
V předložené práci studuji možnosti morfologického značkování češtiny při použití statistického značkovače založeného na skrytých Markovových modelech (HMM taggeru). Zejména pak ověřuji vliv: různě velkých trénovacích dat, délky tagovací historie, nastavení parametru 'n' ve variantě výběru n nejlepších průchodů (varianta n-best) a omezení sady tagů v historii značek na úspěšnost značkovače. Text je doplněn řadou tabulek s výsledky běhu značkovače včetně porovnání s předchozími výsledky jiných značkovačů. V příloze se na kompaktním disku nachází testovací data a program, jehož výsledky jsou zde prezentovány.
Určení smysluplnosti české věty na základě syntaktické informace
Rovenský, Vladimír ; Bojar, Ondřej (oponent) ; Vidová Hladká, Barbora (vedoucí práce)
Práce se zabývá navržením znalostního algoritmu pro rozpoznání smysluplnosti věty. Jedná se o velmi zajímavou úlohu v rámci zpracování přirozeného jazyka, například pro potřeby internetových vyhledávačů. "Smysluplnost" věty nelze de novat absolutně - v našem návrhu respektujeme systém rovin popisu přirozeného jazyka. Tento přístup vychází z koncepce tří vrstev, a sice vrstvy morfologické, syntaktické a sémantické - bakalářská práce bude pokrývat první dvě z těchto tří vrstev. Cílovým jazykem bude čeština.
Interface k online internetovým přenosům v přirozeném jazyce
Macošek, Jan ; Vidová Hladká, Barbora (oponent) ; Hajič, Jan (vedoucí práce)
Tento text popisuje práci na vytvoření interfacu k živým internetovým přenosům. Ty bylo nutné převést z textové podoby do podoby hlasové a následně přehrát na elektronickém králíkovi Nabaztagovi. Uživateli je pak umožněno hlasové ovládání, a tak se text zabývá i trénováním akustických modelů sadou HTK a jejich následnému zapojení v rozpoznávání řeči programem Julius. Kromě toho je rozebráno i samotné hledání a zpracování přenosů a řešení některých problémů, které vznikly při syntéze řeči aplikované na sportovní texty.
Automatické kombinace rysů a šablon rysů
Dubovský, Jakub ; Vidová Hladká, Barbora (oponent) ; Novák, Václav (vedoucí práce)
Hľadanie užitočných kombinácií rysov a šablón rysov je netriviálna úloha. Kombinácie sú však hodnotným nástrojom pri zvyšovaní úspešnosti strojového učenia. V tejto práci je navrhovaný postup, ktorý by sám hľadal užitočné kombinácie kategoriálnych rysov a ich šablón. Proces hľadania bol zverený metódam simulovaného žíhania a upravenému genetickému algoritmu. Súčasťou je návrh funkcie, ktorá hodnotí kvalitu kategoriálnej šablóny. Kombinujú sa samostatne šablóny, rysy a tiež obe spoločne. Najlepšie zlepšenia nájdené navrhnutým postupom sú približne 0.1 percentného bodu. Pokusy prebiehali na dvoch datasetoch. Navrhnutý postup je teda potrebné testovať na ďalších dátach, aby sa overila všeobecná použiteľnosť. Pokusy však naznačujú, že by sa mohlo jednať o základ použiteľného algoritmu. Súčasťou práce je jednoduchá aplikácia, ktorá bola navrhnutá a používaná na vykonávanie experimentov.
Určování syntaktické smysluplnosti českých vět
Kríž, Vincent ; Mírovský, Jiří (oponent) ; Vidová Hladká, Barbora (vedoucí práce)
Určovanie syntaktickej zmysluplnosti viet je zaujímavou a užitočnou úlohou v aplikáciách počítačového spracovania prirodzeného jazyka, napríklad v strojovom preklade, vyhľadávacích strojoch a v systémoch zodpovedania otázok. Teoretická lingvistika skúma prirodzený jazyk ako systém rovín. V našom projekte tento pohľad rešpektujeme a berieme do úvahy pri definovaní zmysluplnosti. Zmysluplnosť skúmame na základe morfologickej a syntaktickej roviny. V práci implementujeme znalostnú (pravidlovú) procedúru, ktorá o reťazci českých slov rozhodne, či je zmysluplný, alebo nie. Pred spustením procedúry bude reťazec slov analyzovaný externými modulmi, ktoré dodajú morfologické a syntaktické informácie o reťazci. Cieľovým jazykom je čeština.
Morfologická disambiguace češtiny pomocí Markovkých modelů
Dufková, Kateřina ; Podveský, Petr (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Ve své bakalářské práci jsem se rozhodla věnovat morfologické disambiguaci textu. Tato úloha má své opodstatnění především v oblasti překladu přirozených jazyků, kde slouží k předzpracování textu určeného k přeložení tak, aby z něj byly odstraněny nejednoznačnosti ve slovních druzích a dalších morfologických kategoriích, které by v dalších fázích překladu působily problémy anebo neúnosně zvyšovaly jeho časovou náročnost. Zvolila jsem statistický přístup k tomuto problému, který je v porovnání s dalšími možnými metodami rychlejší, univerzálnější a je schopen vždy jednoznačně určit kategorii slova. Svoji aplikaci KDTagger, kterou jsem vytvořila v rámci této bakalářské práce, jsem založila na teorii skrytých Markovských modelů. Mým cílem bylo vytvořit takový program, který by byl univerzální co do operačního systému i způsobu ovládání a umožňoval zároveň nastavení všech důležitých lingvistických parametrů pro odborníky i komfortní použití pro laiky. Součástí mé práce byla rozsáhlá testování vytvořené aplikace, které jsem prováděla na českých novinových textech z Pražského závislostního korpusu verze 2.0. Aplikace je ovšem bez sebemenší změny použitelná i na libovolný jiný přirozený jazyk. Powered by TCPDF (www.tcpdf.org)
Pražský závislostní korpus jako cvičebnice jazyka českého
Kučera, Ondřej ; Vidová Hladká, Barbora (vedoucí práce) ; Panevová, Jarmila (oponent)
Pražský závislostní korpus (PDT) patří mezi nejvýznamnější jazykové korpusy na světě. Cílem této práce je představit softwarový systém, který nad daty PDT tvoří cvičebnici českého jazyka. Procvičování probíhá ve dvou oblastech: tvarosloví (určování slovních druhů a jejich morfologických kategorií) a větný rozbor (určování větných členů a závislostí mezi nimi). Vzhledem k odlišnostem mezi akademickými rozbory vět a rozbory tak, jak jsou vyučovány ve školách, však nelze data PDT použít zcela přímočaře. Mnoho vět je potřeba z dat úplně vyřadit, na ostatních je nutné provést množství transformací, které převedou původní reprezentaci do tvaru, na který jsou žáci zvyklí ze školy.

Národní úložiště šedé literatury : Nalezeno 64 záznamů.   začátekpředchozí55 - 64  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.