Original title:
Detekce anomálií v datech výzkumu PROSO
Authors:
Šormová, Hana Document type: Master’s theses
Year:
2014
Language:
cze Abstract:
[cze][eng] Diplomová práce se zabývá detekcí anomálií v datech výzkumu Problem Solving Tutor pomocí detekčních algoritmů. Práce v teoretické části čtenáře seznamuje s pojmem anomálie, myšlenkami výzkumu PROSO a podrobným přehledem existujících algoritmů pro detekci anomálií. V praktické části jsou implementovány algoritmy, které byly hlouběji popsány v předchozí části práce. Jsou zde uvedeny reálné výstupy, doporučení pro uživatele a kapitola je doplněna množstvím grafů. Jednotlivé implementované algoritmy jsou dále srovnány s existujícími softwarovými nástroji, které se zabývají dolováním informací z dat. Součástí práce je ukázka práce s jednotlivými dataminingovými nástroji a jejich výstupy pro data z PROSO. Práce je zakončena stanovením vhodné metodiky pro analýzu chování a detekce anomálií v datech.The thesis deals with algorithms for detecting anomalies in the data collected by the Problem Solving Tutor research. In the theoretical part, the author introduces the term of anomaly, the ideas of the PROSO research and a detailed overview of existing algorithms to detect anomalies. In the practical part, selected algorithms are implemented. Real outputs and results as well as recommendations to a user are presented in this part, and the chapter is supplemented by a number of graphs. The implemented algorithms are also compared to existing data mining software. An example of working with the data mining tools, applied to the data coming from PROSO, and explanation of their outputs is also part of the thesis. In the summary, the appropriate methodology for behavior analysis and anomaly detection is determinied.
Keywords:
anomálie; dataminingové nástroje; detekční algoritmus; proso; Python; scatter plot; skill hráče; variabilita hráče