Original title:
Klasifikace obsahu dokumentů
Translated title:
Classification of document contents
Authors:
Major, Martin ; Spoustová, Johanka (referee) ; Mareš, Martin (advisor) Document type: Bachelor's theses
Year:
2009
Language:
cze Abstract:
[cze][eng] Tato práce se zabývá možnostmi automatické klasifikace textových dokumentů a ukazuje výhody této klasifikace i úskalí při její implementaci. Představuje několik metod a podrobněji se zabývá metodami založenými na analýze propojení dokumentů a bayesovském filtrování. Součástí práce jsou testy na reálných webových stránkách, které mají otestovat kvality jednotlivých klasifikačních metod.This paper deals with automatic classification of text documents, showing advantages of the classification as well as showing difficulty during implementation. It presents several methods in detail, based on analysis of document linking and bayesian filtering. Part of the task is testing on real web pages which should demonstrate the quality of the specific verification methods used.
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/26854