Název:
Budoucnost kreditního skóringu s pokročilými technikami
Překlad názvu:
The future of credit scoring modelling using advanced techniques
Autoři:
Čermáková, Jolana ; Krištoufek, Ladislav (vedoucí práce) ; Geršl, Adam (oponent) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
eng
Abstrakt: [eng][cze] Machine learning is becoming a part of everyday life and has an indisputable impact across large array of industries. In the financial industry, this impact lies particularly in predictive modelling. The goal of this thesis is to describe the basic principles of artificial intelligence and its subset, machine learning. The most widely used machine learning techniques are outlined both in a theoretical and a practical way. As a result, four models were assembled within the thesis. Results and limitations of each model were discussed and these models were also mutually compared based on their individual per- formance. The evaluation was executed on a real world dataset, provided by Home Credit company. Final performance of machine learning methods, measured by the KS and GINI metrics, was either very comparable or even worse than the performance of a traditional logistic regression. Still, the problem may lie in an insu cient dataset, in the improper data prepara- tion, or in inappropriately used algorithms, not necessarily in the models themselves.Machine learning, neboli strojové učení, se stává součástí každodenního života a má nepopiratelný vliv na celou řadu odvětví. Ve finančním odvětví tento dopad spočívá zejména v prediktivním modelování. Cílem této práce je popsat základní principy umělé inteligence, především její podmnožiny, strojového učení. Nejpoužívanější techniky strojového učení jsou v této práci nastíněny teoretickou i praktickou cestou. V rámci práce byly sestaveny čtyři praktické modely. Byly diskutovány výsledky a limitace každého z modelů a zároveň byly modely mezi sebou vzájemně porovnány na základě jejich indi- viduálních výkonů. Modelování bylo provedeno na reálných datech, poskyt- nutých společností Home Credit. Výsledný výkon metod, založených na strojovém učení a měřený pomocí metrik KS a GINI, byl bud' velmi srovn- atelný, nebo dokonce horší než výkon tradičně používané logistické regrese. Přesto mohl tento výsledek spočívat například v nedostatečném datovém souboru, v nesprávné přípravě dat, nebo v nevhodně použitých algoritmech, tedy ne nutně v samotných modelech.
Klíčová slova:
Finanční odvětví; Kreditní hodnocení; Prediktivní modelování; Strojové učení; Úvěrové riziko; Credit risk; Credit scoring; Financial industry; Machine learning; Predictive modelling