Název: Fast Dependency-Aware Feature Selection in Very-High-Dimensional Pattern Recognition Problems
Autoři: Somol, Petr ; Grim, Jiří
Typ dokumentu: Výzkumné zprávy
Rok: 2011
Jazyk: eng
Edice: Research Report, svazek: 2295
Abstrakt: The paper addresses the problem of making dependency-aware feature selection feasible in pattern recognition problems of very high dimensionality. The idea of individually best ranking is generalized to evaluate the contextual quality of each feature in a series of randomly generated feature subsets. Each random subset is evaluated by a criterion function of arbitrary choice (permitting functions of high complexity). Eventually, the novel dependency-aware feature rank is computed, expressing the average benefit of including a feature into feature subsets. The method is efficient and generalizes well especially in very-high-dimensional problems, where traditional context-aware feature selection methods fail due to prohibitive computational complexity or to over-fitting. The method is shown well capable of over-performing the commonly applied individual ranking which ignores important contextual information contained in data.
Klíčová slova: classification; feature selection,; generalization; high dimensionality; machine learning; over-fitting; pattern recognition; ranking; stability
Číslo projektu: CEZ:AV0Z10750506 (CEP), 1M0572 (CEP), 2C06019 (CEP)
Poskytovatel projektu: GA MŠk, GA MŠk

Instituce: Ústav teorie informace a automatizace AV ČR (web)
Informace o dostupnosti dokumentu: Dokument je dostupný na externích webových stránkách.
Externí umístění souboru: http://library.utia.cas.cz/separaty/2011/RO/somol-fast dependency-aware feature selection in very-high-dimensional pattern recognition problems.pdf
Původní záznam: http://hdl.handle.net/11104/0195583

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-42716


Záznam je zařazen do těchto sbírek:
Věda a výzkum > AV ČR > Ústav teorie informace a automatizace
Zprávy > Výzkumné zprávy
 Záznam vytvořen dne 2011-07-04, naposledy upraven 2024-01-26.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet