Název:
Využití Bayesovských sítí pro predikci korporátních bankrotů
Překlad názvu:
Corporate Bankruptcy Prediction Using Bayesian Classifiers
Autoři:
Hátle, Lukáš ; Witzany, Jiří (vedoucí práce) ; Málek, Jiří (oponent) Typ dokumentu: Diplomové práce
Rok:
2014
Jazyk:
cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [cze][eng] Cílem práce je zhodnotit použití bayesovských klasifikátorů v predikci korporátních bankrotů. Získané výsledky naznačují, že bayesovské klasifikátory dosahují srovnatelných výsledků s častěji používanými metodami v této oblasti, jako jsou logistická regrese a rozhodovací stromy. Srovnání bylo provedeno na základě vlastní analýzy na datových souborech z České republiky a Polska. Celková úspěšnost naivních bayesovských klasifikátorů používajících entropickou diskretizaci s hybridním předvýběrem vysvětlujících atributů je pro český datový soubor 77,19 %, pro polský 79,63 %. Hodnoty AUC jsou pro příslušné datové soubory 0,81 a 0.87. Dosažené výsledky na polském datovém souboru byly porovnány s již publikovanými články od Tsaie (2009) a Wanga et al. (2014), které aplikují jiné klasifikační algoritmy na stejný datový soubor. Navrhované metody v této práci vycházejí ze srovnání velice úspěšně. Práce dále nabízí srovnání jednotlivých přístupů k diskretizaci numerických atributů a výběru relevantních vysvětlujících atributů. Tyto oblasti se ukazují pro zvýšení výkonnosti naivního bayesovského klasifikátoru jako klíčové.The aim of this study is to evaluate feasibility of using Bayes classifiers for predicting corporate bankruptcies. The results obtain show that Bayes classifiers do reach comparable results to then more commonly used methods such the logistic regression and the decision trees. The comparison has been carried out based on Czech and Polish data sets. The overall accuracy rate of these so called naive Bayes classifiers, using entropic discretization along with the hybrid pre-selection of the explanatory attributes, reaches 77.19 % for the Czech dataset and 79.76 % for the Polish set respectively. The AUC values for these data sets are 0.81 and 0.87. The results obtained for the Polish data set have been compared to the already published articles by Tsai (2009) and Wang et al. (2014) who applied different classification algorithms. The method proposed in my study, when compared to the above earlier works, comes out as quite successful. The thesis also includes comparing various approaches as regards the discretisation of numerical attributes and selecting the relevant explanatory attributes. These are the key issues for increasing performance of the naive Bayes classifiers
Klíčová slova:
Bayesovská klasifikace; Diskretizace numerických atributů; Naivní baysovský kalsifikátor; Predikce korporátních bankrotů; Výběr vysvětlujících atributů; Bayes classification; Corporate bankruptcy prediction; Discretization of continuous variables; Feature selection; Naive Bayes classifiers
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/44122