Název:
Klasifikace dokumentů podle tématu
Překlad názvu:
Document Topic Classification
Autoři:
Oravec, Jakub ; Černocký, Jan (oponent) ; Smrž, Pavel (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2008
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Táto bakalárska práca sa zaoberá automatickou klasifikáciou dokumentov podľa témy a poskytuje stručný úvod do tejto oblasti výskumu. V prvej časti obsahuje prehľad základných postupov používaných v strojovom spracovaní prirodzeného jazyka s dôrazom na metódy klasfikácie textu. V ďalšej časti sa popisuje návrh a implementácia systému pre automatickú klasifikáciu dokumentov podľa témy. Posledná časť obsahuje informácie o testovaní vytvoreného systému vrátane vytvorenia testovacej sady a popisu štandardných metrík.
This bachelor's thesis deals with automatic document topic classification and provides a brief introduction to this area of research. The first part contains summary of basic techniques used in natural language processing with emphasis on text classification methods. The next part describes concept and implementation of system for automatic document topic classification. The last part contains information about testing of created system including composition of testing set and standard metrics description.
Klíčová slova:
klasifikácia dokumentov podľa témy; metriky; support vector machines; trénovacia sada; document topic classification; metrics; support vector machines; training set
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/55401