Název:
Empirické porovnání volně dostupných systémů dobývání znalostí z databází
Překlad názvu:
Empirical comparison of free software suites for knowledge discovery from data
Autoři:
Kasík, Josef ; Berka, Petr (vedoucí práce) ; Rauch, Jan (oponent) Typ dokumentu: Diplomové práce
Rok:
2009
Jazyk:
cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [cze][eng] Tématem a cílem práce je srovnání volně dostupných systémů k dobývání znalostí z databází. Předmětem srovnání je šest konkrétních aplikací vyvíjených v rámci univerzitních projektů jako experimentální nástroje v oblasti data miningu i jako prostředky pro výukové účely. Kritéria srovnání jsou odvozena ze čtyř obecných pohledů, dle kterých je na jednotlivé systémy nahlíženo. Každý z nich je hodnocen jako nástroj k řešení reálných úloh dobývání, nástroj podporující fáze metodiky CRISP-DM, nástroj schopný praktického nasazení na konkrétních datech a také jako běžný softwarový systém. Z těchto pohledů vyplývá 31 dílčích kritérií srovnání, jejichž ohodnocení bylo stanoveno důkladným rozborem všech systémů. Výsledky komparace potvrdily předpokládanou skutečnost. Nejlépe dopadl program Weka, který vyniká především množstvím dostupných metod strojového učení, bohatými nástroji k předzpracování dat a rychlostí zpracování.Both topic and main objective of the diploma thesis is a comparison of free data mining suites. Subjects of comparison are six particular applications developed under university projects as experimental tools for data mining and mediums for educational purposes. Criteria of the comparison are derived from four general aspects that form the base for further analyses. Each system is evaluated as a tool for handling real-time data mining tasks, a tool supporting various phases of the CRISP-DM methodology, a tool capable of practical employment on certain data and as a common software system. These aspects bring 31 particular criteria for comparison, evaluation of whose was determined by thorough analysis of each system. The results of comparison confirmed the anticipated assumption. As the best tool the Weka data mining suite was evaluated. The main advantages of Weka are high number of machine learning algorithms, numerous data preparation tools and speed of processing.
Klíčová slova:
data mining; dobývání znalostí; kritéria srovnání; porovnání; sady k dobývání znalostí; srovnání; systémy k dobývání znalostí; comparison; criteria; data mining; knowledge discovery from data; software suites
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/14761