Original title:
Automatické osvojení vzorů s minimální supervizí
Translated title:
Automatické osvojení vzorů s minimální supervizí
Authors:
Klíč, Radoslav ; Hana, Jiří (advisor) ; Hlaváčová, Jaroslava (referee) Document type: Master’s theses
Year:
2012
Language:
eng Abstract:
[eng][cze] The thesis presents a semi-supervised morphology learner developed by extending Paramor (Monson, 2009), an unsupervised system, to accept easy to obtain manually provided data in the form of inflections with marked morpheme boundary. In addition, a hierarchical clustering framework allowing combination of multiple sources of information was developed as a part of the thesis. The approach was tested on Czech, Slovene, German and Catalan and has shown increased F-measure in comparison with the Paramor baseline.Diplomová práce popisuje algoritmus pro automatické osvojení vzorů s minimální supervizí, který vznikl rozšířením systému Paramor (Monson, 2009), fungujícího zcela bez supervize. Systém je modifikován, aby přijímal snadno dostupná data ve formě ohýbaných slov s označenou hranicí morfémů jako dodatečný vstup. Součástí práce je také knihovna pro hierarchické shlukování, která umožňuje kombinaci různých zdrojů informací. Přístup byl testován na češtině, slovinštině, němčině a katalánštině a vykázal zvýšenou F-míru v porovnáni se základním Paramorem.
Keywords:
inflectional paradigms; machine learning; morphology; phonology; fonologie; morfologie; strojové učení; vzory
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/39826