Název:
Bankruptcy prediction models in the Czech economy: New specification using Bayesian model averaging and logistic regression on the latest data
Překlad názvu:
Bankruptcy prediction models in the Czech economy: New specification using Bayesian model averaging and logistic regression on the latest data
Autoři:
Kolísko, Jiří ; Princ, Michael (vedoucí práce) ; Červinka, Michal (oponent) Typ dokumentu: Diplomové práce
Rok:
2017
Jazyk:
eng
Abstrakt: [eng][cze] The main objective of our research was to develop a new bankruptcy prediction model for the Czech economy. For that purpose we used the logistic regression and 150,000 financial statements collected for the 2002-2016 period. We defined 41 explanatory variables (25 financial ratios and 16 dummy variables) and used Bayesian model averaging to select the best set of explanatory variables. The resulting model has been estimated for three prediction horizons: one, two, and three years before bankruptcy, so that we could assess the changes in the importance of explanatory variables and models' prediction accuracy. To deal with high skew in our dataset due to small number of bankrupt firms, we applied over- and under- sampling methods on the train sample (80% of data). These methods proved to enhance our classifier's accuracy for all specifications and periods. The accuracy of our models has been evaluated by Receiver operating characteristics curves, Sensitivity-Specificity curves, and Precision-Recall curves. In comparison with models examined on similar data, our model performed very well. In addition, we have selected the most powerful predictors for short- and long-term horizons, which is potentially of high relevance for practice. JEL Classification C11, C51, C53, G33, M21 Keywords Bankruptcy...Hlavním cílem našeho výzkumu bylo vyvinout nový bankrotní model pro českou ekonomiku. Za tím účelem jsme použili logistickou regresi a vzorek 150 000 finančních výkazů pro období 2002-2016. Pracovali jsme celkově s 41 vysvětlujícími proměnnými, z čehož 25 byly finanční poměrové ukazatele a 16 dummy proměnné, k selekci nejlepších prediktorů bylo využito Bayesovské průměrování modelů. Výsledný model byl odhadnut pro 3 predikční horizonty, jeden, dva a tři roky před bankrotem, abychom mohli vyhodnotit vývoj v signifikanci jednotlivých proměnných a přesnost modelů pro různé horizonty. Protože jsme měli významně méně dat pro bankrotující společnosti, použili jsme metody tzv. over-samplingu a under- samplingu pro data, která byla použita k odhadování našich modelů (80% celého vzorku). Tyto metody se ukázaly být velice efektivní, protože zlepšily predikční schopnosti modelů napříč časovými horizonty. Přesnost predikcí jsme měřili pomocí ROC křivek, Sensitivity-Specificity křivek a Precision-Recall křivek. V porovnání s modely odhadnutými na českých datech náš model dopadl velice dobře. Pomocí analýzy ekonomické a statistické signifikance odhadnutých parametrů jsme navíc vybrali nejlepší proměnné pro predikce v krátkodobém a dlouhodobém horizontu, což má přidanou hodnotu pro praktické použití. Klasifikace...
Klíčová slova:
Bayesovské průměrování modelů; Logistická regrese; Predikce úpadku; ROC křivky; Bankruptcy prediction; Bayesian model averaging; Logistic regression; Receiver operating characteristics curves