Original title:
Strojové učení v přirozeném jazyce
Translated title:
Machine-Learning in Natural Language Processing
Authors:
Otrusina, Lubomír ; Šilhavá, Jana (referee) ; Smrž, Pavel (advisor) Document type: Bachelor's theses
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá zjednoznačňováním slovních významů pomocí metod strojového učení. Čtenář je krátce seznámen s danou problematikou a jejím historickým vývojem. Jsou zde popsány nejpoužívanější metody a přístupy, speciálně pak naivní Bayesův klasifikátor, který je implementován v systému. Je zde uveden i názorný příklad pro tento klasifikátor. V praktické části je popsán návrh systému využívající tohoto klasifikátoru včetně popisu různých algoritmů použitých v systému. Na závěr je uvedeno vyhodnocení výsledků systému a jejich analýza. Implementovaný systém se zúčastnil soutěže v rámci mezinárodní konfernce sémantického vyhodnocování SemEval-2007.
This beachelor's thesis deals with word sense disambiguation problem using the machine learning techniques. There are shortly presented problems of word sense disambiguation and its timeline. There are described methods and approaches, especially the naive Bayes classifier that is implemented in the system. There's illustrated a simple example of using this classifier. In a practical section is described project of system based on naive Bayes classifier including description of various algorithms used in the system. Finally there are described evaluation and analysis of the system. This created system took part in an international competition on semantic evaluation workshop SemEval-2007.
Keywords:
machine learning; naive Bayes classifier; natural language processing; Semeval; Senseval; supervised learning; word sense disambiguation; naivní Bayesův klasifikátor; Semeval; Senseval; strojové učení; učení s učitelem; zjednoznačňování slovních významů; zpracování přirozeného jazyka
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/56347