Název: Tvorba závislostního korpusu pro jorubštinu s využitím paralelních dat
Překlad názvu: Tvorba závislostního korpusu pro jorubštinu s využitím paralelních dat
Autoři: Oluokun, Adedayo ; Zeman, Daniel (vedoucí práce) ; Rosa, Rudolf (oponent)
Typ dokumentu: Diplomové práce
Rok: 2018
Jazyk: eng
Abstrakt: The goal of this thesis is to create a dependency treebank for Yorùbá, a language with very little pre-existing machine-readable resources. The treebank follows the Universal Dependencies (UD) annotation standard, certain language-specific guidelines for Yorùbá were specified. Known techniques for porting resources from resource-rich languages were tested, in particular projection of annotation across parallel bilingual data. Manual annotation is not the main focus of this thesis; nevertheless, a small portion of the data was verified manually in order to evaluate the annotation quality. Also, a model was trained on the manual annotation using UDPipe.
Klíčová slova: jazyky s nedostatečnými zdroji; universal dependencies; závislostní syntax; annotation; dependency parsing; low-resource; parallel data; part-of-speech tagging; projection; UDPipe

Instituce: Fakulty UK (VŠKP) (web)
Informace o dostupnosti dokumentu: Dostupné v digitálním repozitáři UK.
Původní záznam: http://hdl.handle.net/20.500.11956/101633

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-387891


Záznam je zařazen do těchto sbírek:
Školství > Veřejné vysoké školy > Univerzita Karlova > Fakulty UK (VŠKP)
Vysokoškolské kvalifikační práce > Diplomové práce
 Záznam vytvořen dne 2018-11-15, naposledy upraven 2022-03-04.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet