Národní úložiště šedé literatury Nalezeno 30 záznamů.  začátekpředchozí21 - 30  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Valence sloves v Pražském závislostním korpusu
Urešová, Zdeňka ; Hajičová, Eva (vedoucí práce) ; Lopatková, Markéta (oponent) ; Ondrejovič, Slavo (oponent)
Název práce: Valence sloves v Pražském závislostním korpusu Autor: PhDr. Zdeňka Urešová Katedra/Ústav: Ústav formální a aplikované lingvistiky MFF UK Vedoucí práce: Prof. PhDr. Eva Hajičová, DrSc. Abstrakt: Tato disertační práce popisuje valenci sloves v rámci anotace Praž- ského závislostního korpusu (PDT) a jejím hlavním cílem je popsat valenční slovník PDT-Vallex. Tento slovník vznikl při anotaci PDT a díky svému charakteru se stal významným zdrojem valenční informace využitelné jak pro lingvistický výzkum, tak pro počítačové zpracování přirozeného jazyka. V práci popisujeme nejen koncepci slovníku, která úzce souvisí s pojetím valence v rámci Funkčně generativního popisu, ale i vztah slovníku k PDT. Právě na základě tohoto vztahu - úzkého propojení slovníku s korpusem - věnujeme zvláštní pozornost popisu formálních prostředk· diatezí. Navrhujeme transformační pravidla pro sekundární diateze, s jejichž pomocí se dokážeme vyrovnat s případy, kdy formy slovesných valenčních doplnění ve slovníku neodpovídají formám slovesných doplnění v korpusových textech.
Forma a funkce u substantiv v češtině: vztah pádu a syntaktické funkce. Na materiálu korpusu současné psané češtiny (SYN2005)
Jelínek, Tomáš ; Petkevič, Vladimír (vedoucí práce) ; Lopatková, Markéta (oponent) ; Uličný, Oldřich (oponent)
Pád je v češtině základním prostředkem morfologické roviny, jímž substantiva vyjadřují svou funkci ve větě. Cílem této práce je popsat z frekvenčního hlediska vztah mezi formou a funkcí substantiv, přesněji řečeno, jak často se prosté a předložkové pády substantiv používají k realizaci syntaktických funkcí ve větě. Práce je založena na rozsáhlém korpusu synchronní psané češtiny SYN2005. Abychom získali údaje o frekvencích syntaktických funkcí substantiv ve vztahu k jejich pádům, opatřili jsme korpus SYN2005 závislostním syntaktickým značkováním, jehož formát jsme převzali z analytické roviny Pražského závislostního korpusu. Syntaktickou anotaci jsme uskutečnili pomocí stochastického MST parseru. Spolehlivost syntaktické anotace však nebyla dostatečně vysoká, vytvořili jsme proto automatický opravný modul, který vyhledává chyby syntaktické anotace ve výstupu stochastického parseru a na základě lingvistických pravidel tyto chyby opravuje. Implementovali jsme 26 různých pravidel, počet chyb anotace se však podařilo snížit jen o 6-8 %. Opravný modul je však možné dále rozvíjet. Lze jím korigovat výstup kteréhokoli závislostního parseru natrénovaného na datech Pražského závislostního korpusu. Syntakticky anotovaný korpus SYN2005 jsme využili jako základ výzkumu frekvence syntaktických funkcí substantiv...
Lexikálně-sémantické konverze ve valenčním slovníku
Kettnerová, Václava ; Lopatková, Markéta (vedoucí práce) ; Panevová, Jarmila (oponent) ; Karlík, Petr (oponent)
V disertační práci podáváme návrh reprezentace lexikálně-sémantických konverzí ve valenčním lexikonu. Lexikálně-sémantické konverze chápeme jako vztahy mezi sémanticky blízkými syntaktickými konstrukcemi tvořenými odlišnými lexikálními jednotkami lexematicky totožného slovesa. Tyto vztahy jsou spojeny se změnami ve valenční struktuře slovesa, které vyplývají ze změn ve vzájemném přiřazení situačních participantů a valenčních doplnění. Tyto změny mohou zasahovat počet, typ valenčních doplnění, jejich obligatornost i morfematickou formu. Na základě sémantické a syntaktické analýzy dvou typů lexikálně-sémantické konverze, lokativní konverze a konverze Nositel děje-Místo, navrhujeme, aby lexikálním jednotkám vytvářejícím syntaktické varianty ve vztahu lexikálně-sémantické konverze v datové části lexikonu odpovídaly odlišné valenční rámce propojené atributem -conv, jehož hodnotou bude typ lexikálně-sémantické konverze. Součástí pravidlové komponenty valenčního lexikonu pak budou pravidla určující změny ve vzájemné korespondenci situačních participantů a valenčních doplnění. Ačkoli reprezentaci lexikálně-sémantické konverze primárně navrhujeme pro účely popisu valence českých sloves ve valenčním slovníku VALLEX, předpokládáme, že poznatky uváděné v této práci mohou být využity při popisu tohoto typu vztahu i v...
Automatické určování sémantických preferencí pro slovesná valenční doplnění
Vandas, Karel ; Lopatková, Markéta (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Slovesná valence hraje důležitou úlohu v popisu chování sloves a propojuje povrchovou realizaci jazyka s jeho sémantikou. Sloveso samotné může být použito ve více významech. Slovesná valenční doplnění pak pomáhají identifikovat správné čtení slovesa. Dosud byla většinou slovesná valenční doplnění studována zejména z morfologického a syntaktického hlediska. Účelem této práce je vyhodnotit možnosti automatického určení sémantických preferencí pro valenční slovesná doplnění. Práce taktéž porovnává úspěšnost systému s různými úrovněmi dostupné informace o valenci ve spojení se shlukovou analýzou. Práce je zakončena evaluací dostupných metod a jejich vzájemným srovnáním.
Typické vzory užívání anglických sloves
Smejkalová, Lenka ; Holub, Martin (vedoucí práce) ; Lopatková, Markéta (oponent)
Metoda CPA (Corpus Pattern Analysis) je korpusová metoda, která analyzuje typické vzory užívání slov v jazykovém korpusu a popisuje význam sloves pomocí kontextových preferencí definovaných jak syntakticky, tak sémanticky [1]. V současné době pomocí CPA a s využitím Britského národního korpusu (BNC) vzniká Slovník vzorů užívání anglických sloves (PDEV, Pattern Dictionary of English Verbs) [1, 2]. Diplomová práce popisuje současný stav slovníku PDEV, zabývá se podrobnou analýzou dostupných dat o typických vzorech užívání anglických sloves a zkoumá, jak lze využít PDEV pro automatickou analýzu lexikálního významu. Dále diplomová práce obsahuje návrh a implementaci procedur pro podporu dalšího vývoje slovníku PDEV. První z nich je extrakce slovesných argumentů z výstupu syntaktické analýzy angličtiny. Druhá procedura využívá tyto extrahované argumenty k vytváření seznamů lexikálních jednotek realizujících sémantické typy. Poslední navržená procedura automaticky rozpoznává typické vzory užívání sloves za pomoci uvedených seznamů ziskaných předchozí procedurou. Součástí práce je též vyhodnocení mezianotátorské shody, evaluace automatické extrakce slovesných argumentů z anglické věty a experimentální ověření účinnosti navržených procedur pro extrakci lexikálních jednotek realizujících jednotlivé sémantické typy a...
Analýza klauzí v českém souvětí
Krůza, Oldřich ; Lopatková, Markéta (oponent) ; Kuboň, Vladislav (vedoucí práce)
Tato diplomová práce se zabývá problematikou identifikace klauzí v českých morfologicky označkovaných větách a vztahů mezi nimi. Problém pojímá jako úlohu strojového učení. Předkládá se formalismus pro vyznačení klauzí a jejich vztahů v českých textech, dále metoda získání dat s vyznačením klauzí z analytické roviny Funkčního generativního popisu ve formalismu PML. Získaná data jsou použita jako trénovací a testovací pro tvorbu systému automatické identifikace klauzí a jejich vztahů. Je navržen systém vyhodnocení výsledku a představeny softwarové aplikace, které vznikly při práci na systému.
Verb Valency Frames Disambiguation
Semecký, Jiří ; Hajič, Jan (vedoucí práce) ; Krbec, Pavel (oponent) ; Lopatková, Markéta (oponent)
Semantic analysis has become a bottleneck of many natural language applications. Machine translation, automatic question answering, dialog management, and others rely on high quality semantic analysis. Verbs are central elements of clauses with strong influence on the realization of whole sentences. Therefore the semantic analysis of verbs plays a key role in the analysis of natural language. We believe that solid disambiguation of verb senses can boost the performance of many real-life applications. In this thesis, we investigate the potential of statistical disambiguation of verb senses. Each verb occurrence can be described by diverse types of information. We investigate which information is worth considering when determining the sense of verbs. Different types of classification methods are tested with regard to the topic. In particular, we compared the Naive Bayes classifier, decision trees, rule-based method, maximum entropy, and support vector machines. The proposed methods are thoroughly evaluated on two different Czech corpora, VALEVAL and the Prague Dependency Treebank. Significant improvement over the baseline is observed.
Mapping the Prague Dependency Treebank Annotation Scheme onto Robust Minimal Recursion Semantics
Jakob, Max ; Štěpánek, Jan (oponent) ; Lopatková, Markéta (vedoucí práce)
This thesis investigates the correspondence between two semantic formalisms, namely the tectogrammatical layer of the Prague Dependency Treebank 2.0 (PDT) and Robust Minimal Recursion Semantics (RMRS). It is a rst attempt to relate the dependency based annotation scheme of PDT to a compositional semantics approach like RMRS. An iterative mapping algorithm that converts PDT trees into RMRS structures is developed that associates RMRSs to each node in the dependency tree. Therefore, composition rules are formulated and the complex relation between dependency in PDT and semantic heads in RMRS is analyzed in detail. It turns out that structure and dependencies, morphological categories and some coreferences can be preserved in the target structures. Furthermore, valency and free modi cations are distinguished using the valency dictionary of PDT as an additional resource. The evaluation result of 81% recall shows that systematically correct underspeci ed target structures can be obtained by a rule-based mapping approach, which is an indicator that RMRS is capable of representing Czech data. This nding is novel as Czech, with its free word order and rich morphology, is typologically di erent from language that used RMRS thus far.
Question and Answer Classifier for closed domain Interactive Question Answering
Dinh, Le Thanh ; Schlesinger, Pavel (oponent) ; Lopatková, Markéta (vedoucí práce)
Nowadays natural language processing has made big progress thanks to the application of statistical approaches and to the large amount of data available to train the systems. These progresses are pushed by the several evaluation campaigns. Thanks to them systems are compared and progress measured. These evaluations are mostly based on data sets artificially developed by the organizers of such evaluation campaigns. In our work we show that though useful these data sets are biased and there is the need of developing data generated in a more natural setting by real users. We consider as case studies the classification of questions. In particular we look at the classification of questions types needed in Question Answering systems, and the classification of follow up questions into topic continuation and topic shift needed in Interactive Question Answering. We evaluate classifiers first on TREC data and than on a corpus of real user's data. In both cases the performance of the classifiers drops significantly showing the need of working on more users centered systems. The results also show that the classifiers could be better fine tuned taking into account the new challenges real users data launch to NLP systems. We leave this for future research.

Národní úložiště šedé literatury : Nalezeno 30 záznamů.   začátekpředchozí21 - 30  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.