Název: Automatická identifikace citátů
Překlad názvu: Automatic detection and attribution of quotes
Autoři: Ustinova, Evgeniya ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Typ dokumentu: Diplomové práce
Rok: 2023
Jazyk: eng
Abstrakt: Quotations extraction and attribution are important practical tasks for the media, but most of the presented solutions are monolingual. In this work, I present a complex machine learning-based system for extraction and attribution of direct and indirect quo- tations, which is trained on English and tested on Czech and Russian data. Czech and Russian test datasets were manually annotated as part of this study. This system is com- pared against a rule-based baseline model. Baseline model demonstrates better precision in extraction of quotation elements, but low recall. The machine learning-based model is better overall in extracting separate elements of quotations and full quotations as well. 1
Klíčová slova: NLP; NLP|quotation extraction|quotation attribution|CRFs|article|annotation

Instituce: Fakulty UK (VŠKP) (web)
Informace o dostupnosti dokumentu: Dostupné v digitálním repozitáři UK.
Původní záznam: http://hdl.handle.net/20.500.11956/181574

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-528862


Záznam je zařazen do těchto sbírek:
Školství > Veřejné vysoké školy > Univerzita Karlova > Fakulty UK (VŠKP)
Vysokoškolské kvalifikační práce > Diplomové práce
 Záznam vytvořen dne 2023-07-09, naposledy upraven 2023-12-31.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet