Original title:
Zjednoznačňování slovních významů
Translated title:
Word Sense Disambiguation
Authors:
Kraus, Michal ; Glembek, Ondřej (referee) ; Smrž, Pavel (advisor) Document type: Master’s theses
Year:
2008
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Diplomová práce je zaměřena na rozpoznávání a zjednoznačňování českých slov. Nejprve se čtenář seznámí s historickým kontextem úkolu, poté jsou mu předvedeny použité algoritmy: naivní Bayesův klasifikátor, klasifikátor AdaBoost, metoda maximální entropie a rozhodovací strom. Použité metody jsou názorně předvedeny na příkladu. V dalších částech práce jsou popsány datové sady a parametry pro klasifikaci. V závěrečné části práce dojde na zhodnocení výsledků a nastínění možných úprav.
The master's thesis deals with sense disambiguation of Czech words. Reader is informed about task's history and used algorithms are introduced. There are naive Bayes classifier, AdaBoost classifier, maximum entrophy method and decision trees described in this thesis. Used methods are clearly demonstrated. In the next parts of this thesis are used data also described. Last part of the thesis describe reached results. There are some ideas to improve the system at the end of the thesis.
Keywords:
AdaBoost classifier; classifiers; Czech language; decision trees; maximum entrophy method; naive Bayes classifier; natural language processing; word sense disambiguation; klasifikační algoritmy; klasifikátor AdaBoost; metoda maximální entropie; naivní Bayesův klasifikátor; rozhodovací stromy; zjednoznačňování slovních významů; zpracování přirozeného jazyka; český jazyk
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53207