Original title:
Porovnání výpočetní složitosti vybraných algoritmů pro dolování znalosti z dat
Authors:
Matzke, Miroslav Document type: Master’s theses
Year:
2018
Language:
cze Abstract:
[cze][eng] Matzke, M. Porovnání výpočetní složitosti vybraných algoritmů pro dolování znalosti z dat, Diplomová práce. Brno, 2018. Tato Diplomová práce se zabývá porovnáváním zejména časové složitosti a úspěšnosti klasifikace vybraných algoritmů pro dolování znalosti z dat se zaměřením na neuronové sítě a optimálním nastavením pro vykonání práce. V teoretické části je podstatou seznámit se s rozdělením algoritmů, jejich funkcionalitou a složitostí. Poté následuje výběr použitých algoritmů se zaměřením na neuronové sítě a jejich nastavení, především skrytých vrstev, momenta a learning rate. Následuje část zabývající se daty použitými pro samotné experimentální testování, která jsou nominální i numerická, a taktéž reálná nebo generovaná. Také je zde uvedena přesnost měření a měření výkonu dvou sestav použitých na testování jednotlivých experimentů. Třetí částí je samotné testování časové složitosti a procentuální úspěšnosti algoritmů a výstup zejména v grafické podobě následovaný rozborem a doporučením z výsledků se zaměřením na optimální nastavení vůči nastavením automatickým a počátečním.Matzke, M. Comparison of Computational Complexity of Selected Data Mining Algorithms, Diploma Thesis. Brno, 2018. This diploma thesis deals with the comparison of the time complexity and the success of the classification of selected algorithms for mining knowledge from data with focus on neural networks and optimal settings for work execution. In the theoretical part, it is essential to get acquainted with the distribution of algorithms, their functionality and complexity. Then follows the selection of algorithms with focus on neural networks and their settings, especially hidden layers, momentum and learning rate. Another part deals with data used for experimental testing, which are both nominal and numerical data, and also real or generated. Also included is the accuracy of measurement and performance measurement of the two assemblies used to test individual experiments. The third part is the testing of the time complexity and the percentage success of the algorithms and the output especially in graphical form followed by analysis and recommendations from the results with focus on the optimal setting against the automatic and initial settings.
Keywords:
dolování dat; neuronová síť; procentuální úspěšnost klasifikace; rozbor nastavení; test výkonnosti; Weka; časová složitost