Název:
Klasifikace obsahu dokumentů
Překlad názvu:
Classification of document contents
Autoři:
Major, Martin ; Spoustová, Johanka (oponent) ; Mareš, Martin (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2009
Jazyk:
cze
Abstrakt: [cze][eng] Tato práce se zabývá možnostmi automatické klasifikace textových dokumentů a ukazuje výhody této klasifikace i úskalí při její implementaci. Představuje několik metod a podrobněji se zabývá metodami založenými na analýze propojení dokumentů a bayesovském filtrování. Součástí práce jsou testy na reálných webových stránkách, které mají otestovat kvality jednotlivých klasifikačních metod.This paper deals with automatic classification of text documents, showing advantages of the classification as well as showing difficulty during implementation. It presents several methods in detail, based on analysis of document linking and bayesian filtering. Part of the task is testing on real web pages which should demonstrate the quality of the specific verification methods used.