Název:
Koreference z mezijazykové perspektivy
Překlad názvu:
Coreference from the Cross-lingual Perspective
Autoři:
Novák, Michal ; Žabokrtský, Zdeněk (vedoucí práce) ; Stede, Manfred (oponent) ; Rosen, Alexandr (oponent) Typ dokumentu: Disertační práce
Rok:
2018
Jazyk:
eng
Abstrakt: [eng][cze] Coreference from the Cross-lingual Perspective Michal Nov'ak The subject of this thesis is to study properties of coreference using cross- lingual approaches. The work is motivated by the research on coreference-related linguistic typology. Another motivation is to explore whether differences in the ways how languages express coreference can be exploited to build better models for coreference resolution. We design two cross-lingual methods: the bilingually informed coreference resolution and the coreference projection. The results of our experiments with the methods carried out on Czech-English data suggest that with respect to coreference English is more informative for Czech than vice versa. Furthermore, the bilingually informed resolution applied on parallel texts has managed to outperform the monolingual resolver on both languages. In the experiments, we employ the monolingual coreference resolver and an improved method for alignment of coreferential expressions, both of which we also designed within the thesis. 1Koreference z mezijazykové perspektivy Michal Novák Tématem této práce je studium vlastností koreference s použitím mezijazy- kových přístupů. Motivací práce je výzkum lingvistické typologie založené na koreferenci. Další motivací je prozkoumání, jestli rozdíly ve způsobech, jak ja- zyky vyjadřují koreferenci, mohou být využity k natrénování lepších modelů pro rozpoznávání koreference. Navrhujeme dvě mezijazykové metody: rozpoznávání koreference s informací z druhého jazyka a projekci koreference. Výsledky našich experimentů s těmito metodami na česko-anglických datech naznačují, že s ohle- dem na koreferenci přináší angličtina více informací do češtiny než naopak. Rozpoznávání koreference s informací z druhého jazyka navíc dokázalo při apli- kaci na paralelních datech překonat na obou jazycích výsledky jednojazykového systému na rozpoznávání. Při experimentech používáme jednojazykový roz- poznávač koreference a vylepšenou metodu na zarovnání koreferenčních výrazů, které jsme rovněž navrhli v rámci této práce. 1
Klíčová slova:
anaphora; anaphora resolution; bilingually informed coreference resolution; coreference; coreference projection; coreference resolution; cross-lingual processing; word alignment; anafora; koreference; mezijazykové zpracování; projekce koreference; rozpoznávání anafory; rozpoznávání koreference; rozpoznávání koreference s informací z druhého jazyka; slovní zarovnání