Original title:
Does It Make Sense to Develop New Feature Selection Methods?
Translated title:
Má smysl vyvíjet nové metody výběru příznaků?
Authors:
Somol, Petr ; Novovičová, Jana Document type: Research reports
Year:
2007
Language:
eng Series:
Research Report, volume: 2193 Abstract:
[eng][cze] One of hot topics discussed recently in relation to pattern recognition techniques is the question of actual performance of modern feature selection methods. Feature selection has been a highly active area of research in recent years due to its potential to improve both the performance and economy of automatic decision systems in various applicational fields, with medical diagnosis being among the most prominent. Feature selection may also improve the performance of classifiers learned from limited data, or contribute to model interpretability. The number of available methods and methodologies has grown rapidly while promising important improvements. Yet recently many authors put this development in question, claiming that simpler older tools show to be actually better than complex modern ones -- which, despite promises, are claimed to actually fail in real-world applications.Jedno z aktuálních témat diskutovaných v současné době ve vztahu k oboru rozpoznávání je otázka skutečné účinnosti moderních metod výběru příznaků. Výběr příznaků je stále zkoumaná oblast neboť může zlepšit jak účinnost tak i hospodárnost automatických rozhodovacích systémů v mnoha aplikačních oblastech, z nichž mezi nejdůležitější patří lékařská diagnostika. Výběr příznaků může také zlepšit účinnost klasifikátorů, navržených na základě omezeného množství dat, nebo přispět k interpretaci modelů. Zejména poslední dobou bylo vyvinuto mnoho metod a metodologií slibujících významné zlepšení. Nicméně objevila se také řada kritických příspěvků prohlašujících, že jednoduché staré nástroje jsou ve skutečnosti lepší než složité moderní metody, které, navzdory slibům, selhávají v reálných aplikacích. Ve zprávě zkoumáme toto tvrzení, ukazujeme několik ilustrativních příkladů, vyvozujeme závěry a doporučení týkající se očekávané účinnosti metod výběru příznaků.
Keywords:
classification accuracy; feature selection; performance estimation; search methods; subset search Project no.: CEZ:AV0Z10750506 (CEP), 2C06019 (CEP), 1M0572 (CEP), 507752, IAA2075302 (CEP) Funding provider: GA MŠk, GA MŠk, GA AV ČR
Institution: Institute of Information Theory and Automation AS ČR
(web)
Document availability information: Fulltext is available at the institute of the Academy of Sciences. Original record: http://hdl.handle.net/11104/0148168