Název:
Porovnanie metód machine learningu pre analýzu kreditného rizika
Překlad názvu:
Comparison of machine learning methods for credit risk analysis
Autoři:
Bušo, Bohumír ; Kolman, Marek (vedoucí práce) ; Vacek, Vladislav (oponent) Typ dokumentu: Diplomové práce
Rok:
2015
Jazyk:
slo
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [slo][cze][eng] Strojové učenie je v poslednej dobe čoraz častejšie spomínané spolu s oblasťou "Big Data". Jedná sa o oblasť, kde je k dispozícii veľké množstvo dát, z ktorých je potrebné získať užitočné informácie. Keďže v tejto dobe generujeme čoraz viac a viac dát, či už pomocou mobilných zariadení platobných kariet a pod., je otázka spracovania vysoko aktuálna. V tejto práci je opísaných šesť rôznych metód, ktoré slúžia na tento účel. Sú to logistická regresia, plytké a hlboké neurónové siete, bagging, boosting a stacking. Posledné tri spomínané patria do kategórie nazývanej skupinové učenie. Metódy sú ďalej aplikované na reálne dáta z prostredia úverových inštitúcií, kde môžu pomôcť ku klasifikácii potenciálnych klientov pri žiadosti o úver. V závere sú výsledky získané pre jednotlivé metódy porovnané a v krátkosti aj interpretované.Strojové učení je v poslední době stále častěji zmiňované spolu s oblastí,, Big Data ''. Jedná se o oblast, kde je k dispozici velké množství dat, z nichž je třeba získat užitečné informace. Jelikož v této době generujeme stále více a více dat, ať už pomocí mobilních zařízení platebních karet a pod., je otázka zpracování vysoce aktuální. V této práci je popsaných šest různých metod, které slouží k tomuto účelu. Jsou to logistická regrese, mělké a hluboké neuronové sítě, bagging, boosting a stacking. Poslední tři zmíněné patří do kategorie zvané skupinové učení. Metody jsou dále aplikovány na reálná data z prostředí úvěrových institucí, kde mohou pomoci ke klasifikaci potenciálních klientů při žádosti o úvěr. V závěru jsou výsledky získané pro jednotlivé metody porovnány a v krátkosti i interpretovány.Recently, machine learning has been put into connection with a field called ,,Big Data'' more and more. Usually, in this field, a lot of data is available and we need to gather useful information based on this data. Nowadays, when still more and more data is generated by use of mobile phones, credit cards, etc., a need for high-performance methods is serious. In this work, we describe six different methods that serve this purpose. These are logistic regression, neural networks and deep neural networks, bagging, boosting and stacking. Last three methods compose a group called Ensemble Learning. We apply all six methods on real data, which were generously provided by one of the loan providers. These methods can help them to distinguish between good and bad potential takers of loans, when the decision about the loan is being made. Lastly, the results of particular methods are compared and we also briefly outline possible ways of interpretation.
Klíčová slova:
Big Data; klasifikace; strojové učení; Big Data; Classification; Machine Learning
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/51844