Název:
Automatické osvojení vzorů s minimální supervizí
Překlad názvu:
Automatické osvojení vzorů s minimální supervizí
Autoři:
Klíč, Radoslav ; Hana, Jiří (vedoucí práce) ; Hlaváčová, Jaroslava (oponent) Typ dokumentu: Diplomové práce
Rok:
2012
Jazyk:
eng
Abstrakt: [eng][cze] The thesis presents a semi-supervised morphology learner developed by extending Paramor (Monson, 2009), an unsupervised system, to accept easy to obtain manually provided data in the form of inflections with marked morpheme boundary. In addition, a hierarchical clustering framework allowing combination of multiple sources of information was developed as a part of the thesis. The approach was tested on Czech, Slovene, German and Catalan and has shown increased F-measure in comparison with the Paramor baseline.Diplomová práce popisuje algoritmus pro automatické osvojení vzorů s minimální supervizí, který vznikl rozšířením systému Paramor (Monson, 2009), fungujícího zcela bez supervize. Systém je modifikován, aby přijímal snadno dostupná data ve formě ohýbaných slov s označenou hranicí morfémů jako dodatečný vstup. Součástí práce je také knihovna pro hierarchické shlukování, která umožňuje kombinaci různých zdrojů informací. Přístup byl testován na češtině, slovinštině, němčině a katalánštině a vykázal zvýšenou F-míru v porovnáni se základním Paramorem.
Klíčová slova:
fonologie; morfologie; strojové učení; vzory; inflectional paradigms; machine learning; morphology; phonology