Název:
Maximalizace Giniho koeficientu v binární logistické regresi
Překlad názvu:
Gini coefficient maximization in binary logistic regression
Autoři:
Říha, Samuel ; Hanzák, Tomáš (vedoucí práce) ; Hlávka, Zdeněk (oponent) Typ dokumentu: Bakalářské práce
Rok:
2012
Jazyk:
cze
Abstrakt: [cze][eng] V bakalářké práci je popsán model binární logistické regrese. Pomocí pojmu ztrátové funkce jsou odvozeny metody odhadu parametrů modelu. Je definována "bohatá" množina "hezkých" ztrátových funkcí - beta rodina Fisher-konzistentních ztrátových funkcí. V druhé části práce jsou definované základní ukazatele těsnosti modelu - Giniho koeficient, C-statistika, Kolmogorov-Smirnov statistika a koefi- cient determinace R2 . Dále je rozebrána možnost odhadovat parametry modelu maximalizací Giniho koeficientu. K tomuto účelu je navrženo několik algoritmů, které jsou porovnány s již existujícími metodami na jedné sadě simulovaných a třech sadách reálných dat. 1This Bachelor thesis describes a binary logistic regression model. By means of the term loss function a parameter estimation for the model is derived. A "rich" set of "proper" loss functions - beta family of Fisher-consistent loss functions - is defined. In the second part of the thesis, four basic goodness-of-fit criteria - Gini coefficient, C-statistics, Kolmogorov-Smirnov statistics and coefficient of determination R2 are defined. Further on, a possibility of parameter estimation by maximizing the Gini coefficient is analysed. Several algorithms are designed for this purpose. They are compared with so far existing methods in one simulated data set and three real ones. 1
Klíčová slova:
Binární logistická regrese; Giniho koeficient; maximalizace Giniho koeficientu; metoda maximální věrohodnosti; ztrátová funkce; Binary logistic regression; Gini coefficient; Gini coefficient maximization; loss function; maximum likelihood