Název:
The best of two worlds: cooperation of statistical and rule-based taggers for Czech
Překlad názvu:
Dva typy značkování v češtině
Autoři:
Spoustová, D. ; Hajič, J. ; Votrubec, J. ; Krbec, P. ; Květoň, Pavel Typ dokumentu: Příspěvky z konference Konference/Akce: Workshop on Balto-Slavonic Natural Language Processing 2007, Praha (CZ), 2007-06-29
Rok:
2007
Jazyk:
eng
Abstrakt: [eng][cze] Description of several hybrid disambiguation methods combining the strength of hand-written disambiguation rules and statistical taggers. Three different statistical (HMM, Maximum-Entropy and Averaged Perceptron)taggers are used in a tagging experiment using Prague Dependency Treebank. The results of the hybrid systems are better than any other method tried for Czech tagging so far.Popis hybridních disambiguačních metod; použití tří různých statistických taggerů (HMM, Maximum-Entropy, Averaged Perceptron), zhodnocení výsledků.
Klíčová slova:
corpus lingustics; disambiguation; linguistic corpus; tagging Číslo projektu: CEZ:AV0Z90610521 (CEP), 1ET100610409 (CEP), GA407/07/0679 (CEP) Poskytovatel projektu: GA AV ČR, GA ČR Zdrojový dokument: ACL 2007. Proceedings of the Workshop on Balto-Slavonic Natural Language Processing 2007 Poznámka: Související webová stránka: http://www.aclweb.org/anthology/W/W07/W07-1709
Instituce: Ústav pro jazyk český AV ČR
(web)
Informace o dostupnosti dokumentu:
Dokument je dostupný v příslušném ústavu Akademie věd ČR. Původní záznam: http://hdl.handle.net/11104/0157456