Název: Text document classification
Překlad názvu: Klasifikace textových dokumentů
Autoři: Humpolíček, Jiří
Typ dokumentu: Výzkumné zprávy
Rok: 2006
Jazyk: eng
Edice: Research Report, svazek: 2175
Abstrakt: In this report, we propose four feature selection algorithms based on the Best Individual Feature method and one based on the sequential method. After that the best method is selected for following classifier methods comparison. In this step we compare classification performance and computation expense of two classifiers based on Naive Bayes and third classifier is SVM. Classification performance is tested on the Reuters data set and Newsgroup data set. Finally we shows results on the multi-labelled subset of the Reuters data set.
Klíčová slova: classification; text document
Číslo projektu: CEZ:AV0Z10750506 (CEP)

Instituce: Ústav teorie informace a automatizace AV ČR (web)
Informace o dostupnosti dokumentu: Dokument je dostupný v příslušném ústavu Akademie věd ČR.
Původní záznam: http://hdl.handle.net/11104/0139697

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-36266


Záznam je zařazen do těchto sbírek:
Věda a výzkum > AV ČR > Ústav teorie informace a automatizace
Zprávy > Výzkumné zprávy
 Záznam vytvořen dne 2011-07-01, naposledy upraven 2024-01-26.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet