Original title:
Využití Bayesovských sítí pro predikci korporátních bankrotů
Translated title:
Corporate Bankruptcy Prediction Using Bayesian Classifiers
Authors:
Hátle, Lukáš ; Witzany, Jiří (advisor) ; Málek, Jiří (referee) Document type: Master’s theses
Year:
2014
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Cílem práce je zhodnotit použití bayesovských klasifikátorů v predikci korporátních bankrotů. Získané výsledky naznačují, že bayesovské klasifikátory dosahují srovnatelných výsledků s častěji používanými metodami v této oblasti, jako jsou logistická regrese a rozhodovací stromy. Srovnání bylo provedeno na základě vlastní analýzy na datových souborech z České republiky a Polska. Celková úspěšnost naivních bayesovských klasifikátorů používajících entropickou diskretizaci s hybridním předvýběrem vysvětlujících atributů je pro český datový soubor 77,19 %, pro polský 79,63 %. Hodnoty AUC jsou pro příslušné datové soubory 0,81 a 0.87. Dosažené výsledky na polském datovém souboru byly porovnány s již publikovanými články od Tsaie (2009) a Wanga et al. (2014), které aplikují jiné klasifikační algoritmy na stejný datový soubor. Navrhované metody v této práci vycházejí ze srovnání velice úspěšně. Práce dále nabízí srovnání jednotlivých přístupů k diskretizaci numerických atributů a výběru relevantních vysvětlujících atributů. Tyto oblasti se ukazují pro zvýšení výkonnosti naivního bayesovského klasifikátoru jako klíčové.The aim of this study is to evaluate feasibility of using Bayes classifiers for predicting corporate bankruptcies. The results obtain show that Bayes classifiers do reach comparable results to then more commonly used methods such the logistic regression and the decision trees. The comparison has been carried out based on Czech and Polish data sets. The overall accuracy rate of these so called naive Bayes classifiers, using entropic discretization along with the hybrid pre-selection of the explanatory attributes, reaches 77.19 % for the Czech dataset and 79.76 % for the Polish set respectively. The AUC values for these data sets are 0.81 and 0.87. The results obtained for the Polish data set have been compared to the already published articles by Tsai (2009) and Wang et al. (2014) who applied different classification algorithms. The method proposed in my study, when compared to the above earlier works, comes out as quite successful. The thesis also includes comparing various approaches as regards the discretisation of numerical attributes and selecting the relevant explanatory attributes. These are the key issues for increasing performance of the naive Bayes classifiers
Keywords:
Bayes classification; Corporate bankruptcy prediction; Discretization of continuous variables; Feature selection; Naive Bayes classifiers; Bayesovská klasifikace; Diskretizace numerických atributů; Naivní baysovský kalsifikátor; Predikce korporátních bankrotů; Výběr vysvětlujících atributů
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/44122