Original title:
Porovnání nekomerčních nástrojů pro dolování znalosti z dat pomocí strojového učení
Authors:
Ondrejka, Petr Document type: Master’s theses
Year:
2014
Language:
cze Abstract:
[cze][eng] Diplomová práce se zabývá srovnáním vlastností a schopností vybraných softwarových nástrojů pro dolování z dat. Důležitou částí je stanovení a vyhodnocení jednotlivých kriterií, podle kterých se provádí srovnání nástrojů. Je zde vymezena základní problematika strojového učení a dolování z dat. Kriteria srovnání jsou vybrána na základě nezbytných operací nutných pro realizaci procesu dolování z dat. Kriteria jsou vyhodnocována rovnocenně, bez použití vah. Pro porovnání časové a prostorové náročnosti byly vybrány nejpoužívanější algoritmy pro dolování z dat. Výsledkem je popis vybraných nástrojů vycházející z kriterií srovnání a samotné vyhodnocení těchto kriterií. Výsledky srovnání je nutno chápat v závislosti na testovaných datech, zvoleném hardware a nepoužití vah při srovnání.This diploma thesis concerns with features and abilities of chosen software tools for data mining. An important part is the selection and evaluation of each criteria by which the comparison of tools is done. The basic issues of data mining and machine learning are determined here. The comparison criteria are chosen with consideration of the necessary operations that are required to realize the whole process of data mining. The criteria are evaluated on the same level of importance, without weighting. The most widely used algorithms for data mining are chosen for the comparison of time and memory demandingness. The result is the description of selected tools based on the comparison criteria and evaluation of these criteria. The comparison results must be understood with respect of testing data, chosen hardware, and the fact that no weighting was used.
Keywords:
clustering; dolování dat; import a export; klasifikace; KNIME; Orange; podpora algoritmů; prostorová náročnost; předzpracování dat; časová náročnost