Název:
Empirické porovnání komerčních systémů dobývání znalostí z databází
Překlad názvu:
An Empirical Comparison of Commercial Data Mining Tools
Autoři:
Faruzel, Petr ; Berka, Petr (vedoucí práce) ; Máša, Petr (oponent) Typ dokumentu: Diplomové práce
Rok:
2009
Jazyk:
cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [cze][eng] Předkládaná práce "Empirické porovnání komerčních systémů dobývání znalostí z databází" se zabývá systémy dobývání znalostí z databází od předních světových dodavatelů statistického softwaru. Cílem této práce je porovnat komerční systémy IBM SPSS Modeler a SAS Enterprise Miner na základě jejich specifikace a funkčnosti vzhledem k vybrané množině srovnávacích kritérií. Zvoleného cíle chci dosáhnout jednak rozborem vybraných vlastností analyzovaných systémů, jednak jejich aplikací na reálných datech. Základem srovnání je 29 dílčích kritérií odrážejících základní požadavky uživatele na funkcionalitu, použitelnost a otevřenost systému. Stěžejní částí celého srovnávacího procesu je praktické nasazení těchto systémů na datech o meningoencefalitidě. Jeho výsledkem je zhodnocení výkonnosti zkoumaných systémů při analýze malého a velkého objemu dat. Kvalita generovaných výstupů a doba jejich odvození jsou stanoveny na základě aplikace šesti srovnatelných klasifikačních metod dobývání znalostí z databází. Ukázalo se, že systému IBM SPSS Modeler vyhovuje spíše menší objem dat. Nepatrně nižší přesnost klasifikace nalezených datových modelů je zastíněna podstatně vyšší rychlostí jejich odvození. S růstem objemu analyzovaných dat se však situace mění ve prospěch konkurenčního systému. Při analýze velkých dat dosahuje výrazně lepších výsledků systém SAS Enterprise Miner. Podstatně vyšší přesnost klasifikace nalezených modelů je umocněna mírně kratší dobou jejich odvození. Zatímco funkcionalitu analyzovaných systémů lze označit za srovnatelnou, ze srovnání jejich použitelnosti vyšel jako jasný vítěz systém IBM SPSS Modeler. Zhodnocení otevřenosti těchto systémů staví do role mírného favorita systém SAS Enterprise Miner.The presented work "An Empirical Comparison of Commercial Data Mining Tools" deals with data mining tools from world's leading software providers of statistical solutions. The aim of this work is to compare commercial packages IBM SPSS Modeler and SAS Enterprise Miner in terms of their specification and utility considering a chosen set of evaluation criteria. I would like to achieve the appointed goal by a detailed analysis of selected features of the surveyed software packages as well as by their application on real data. The comparison is founded on 29 component criteria which reflect user's requirements regarding functionality, usability and flexibility of the system. The pivotal part of the comparative process is based on an application of the surveyed data mining tools on data concerning meningoencephalitis. Results predestinate evaluation of their performance while analyzing small and large data. Quality of developed data models and duration of their derivation are stated in reference to the use of six comparable data mining techniques for classification. Small data more likely comply with IBM SPSS Modeler. Although it produces slightly less accurate models, their development times are much shorter. Increasing the amount of data changes the situation in favor of competition. SAS Enterprise Miner manages better results while analyzing large data. Considerably more accurate models are accompanied by slightly shorter times of their development. Functionality of the surveyed data mining tools is comparable, whereas their usability and flexibility differentiate. IBM SPSS Modeler offers apparently better usability and learnability. Users of SAS Enterprise Miner have a slightly more flexible data mining tool at hand.
Klíčová slova:
Data mining; IBM SPSS Modeler; SAS Enterprise Miner; Data mining; IBM SPSS Modeler; SAS Enterprise Miner
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/23321