Original title:
Aplikace dataminingových metod na bankovní data
Authors:
Melichar, Miloš Document type: Master’s theses
Year:
2016
Language:
cze Abstract:
[cze][eng] Práce se zabývá procesem přípravy dvou datových množin, které dohromady obsahovaly informace o klientech, úvěrech a kartách. Datové množiny byly odděleně předzpracovány a modelovány pomocí softwaru SPSS Modeler, který obsahuje množství metod a algoritmů pro podporu obou těchto fází. Pro modelování byly definovány tři klasifikační dataminingové úlohy: schvalování či zamítání úvěrů, jejich rating a přidělování vhodného typu debetní karty. Pro každou úlohu byly pomocí vybraných metod strojového učení vytvořeny klasifikační modely, jejichž přesnosti byly testovány s použitím skriptovacího jazyka v SPSS. Problematika řešených úloh byla doplněna o metodu shlukování pomocí skrytých faktorů vytvořených pomocí faktorové analýzy. Shlukování v kombinaci s faktorovou analýzou představuje další přístup v poznávání vzorů v datech v kontextu řešení zkoumaného jevu.The thesis deals with pre-processing of two data sets with information on clients, loans and debit cards. The data sets were separately pre-processed and modeled by SPSS Modeler using a number of methods and algorithms. For the modeling purposes, three classification data mining tasks were defined: loan approving or rejecting, loan rating and debit card type assignment. By using the selected methods of machine learning techniques the classification models were built for each task. Models accuracy was tested by script written in SPSS language for automation. All tasks were supplemented by clustering technique based on latent factors gained by factor analysis. Factor analysis combined with clustering presents another approach in pattern discovery.
Keywords:
bankovní data; faktorová analýza; klasifikace úvěrů; metody strojového učení; nebankovní půjčky; shlukování; SPSS Modeler