Název:
Analytické predikáty s kategoriálním slovesem a jejich využití pro morfologickou anotaci
Překlad názvu:
Light verb constructions and their exploitation for morphological annotation
Autoři:
Vyskočilová, Karolína ; Petkevič, Vladimír (vedoucí práce) ; Radimský, Jan (oponent) ; Kettnerová, Václava (oponent) Typ dokumentu: Disertační práce
Rok:
2023
Jazyk:
cze
Abstrakt: [cze][eng] iii Abstrakt Disertační práce se zaměřuje na analytický predikát s kategoriálním slovesem (dále APKS), tedy spojení jako provádět kontrolu nebo chovat úctu. Ilustruje, jak zúročit teoretické poznání těchto spojení v praxi, vytěžit ho při morfologické disambiguaci, a tím potenciálně ovlivnit i syntaktickou analýzu. Teoretická část práce pokrývá tři oblasti - APKS, značkování korpusů a pravidlový disambiguační systém LanGr. APKS charakterizuje včetně kritérií pro jejich určování, popisuje současný stav jejich poznání a usouvztažňuje příspěvky k tématu, které vyšly v průběhu posledních patnácti let; důraz je přitom kladen zejména na syntaktický pohled na tyto konstrukce. Zároveň práce mapuje existující soupisy těchto spojení. Následuje popis procesu značkování psaných korpusů Českého národního korpusu, s nímž úzce souvisí i systém automatické morfologické disambiguace LanGr, kterému je věnována pozornost jak na teoretické úrovni tvorby pravidel, tak na úrovni jejich zápisu ve stejnojmenném programovacím jazyce. Praktická část práce se zaměřuje na konkrétní výsek morfologické homonymie akuzativních tvarů a zlepšuje morfologickou anotaci na základě nově vytvořených pravidel pro systém LanGr. Nejprve v první případové studii na datech z korpusu SYNv10 identifikuje pravidelnosti APKS s bezpředložkovým akuzativem,...iv Abstract This Ph.D. thesis deals with light verb constructions (LVCs), such as provádět kontrolu (to perform a check) or chovat úctu (to show respect). It demonstrates how to apply theoretical knowledge of these constructions into practice, exploiting it during morphological disambiguation and thus potentially improving syntactic analysis. The theoretical part of the thesis covers three areas: light verb constructions, corpus annotation, and LanGr rule-based morphological disambiguation tagging. At first, LVCs are characterized, including their identification criteria, followed by a description of the current state of research on LVCs and a summary of papers published on the topic over the last fifteen years, with a particular emphasis on the syntactic approach to these constructions. A compilation of existing LVC inventories is also provided. Furthermore, Czech National Corpus written corpora tagging process is outlined, as it is closely related to the LanGr tool. Finally, LanGr rule creation and code implementation are covered. The practical part of the thesis addresses nominative-accusative case homonymy. New rules for the LanGr system are also developed to improve morphological annotation. In a case study, the most frequent forms of direct object LVCs are retrieved using data from the SYNv10 corpus....
Klíčová slova:
analytické predikáty s kategoriálním slovesem|jazykový korpus|morfologická anotace|disambiguace|LanGr; light verb constructions|language corpus|morphological annotation|disambiguation|LanGr