Název:
Vyšetřování závislostí v kategoriálních bankovních datech
Překlad názvu:
Dependence analysis of categorical data from banking
Autoři:
Khýr, Miroslav ; Zichová, Jitka (vedoucí práce) ; Mazurová, Lucie (oponent) Typ dokumentu: Bakalářské práce
Rok:
2015
Jazyk:
cze
Abstrakt: [cze][eng] Název práce: Vyšetřování závislostí v kategoriálních bankovních datech Autor: Miroslav Khýr Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí bakalářské práce: RNDr. Jitka Zichová, Dr., Katedra pravděpodobnosti a matematické statistiky Abstrakt: Cílem práce je podrobně popsat teorii týkající se logaritmicko - lineár- ního rozvoje a grafických modelů pro náhodné vektory s diskrétním rozdělením. Tyto vektory mohou modelovat výskyt kategoriálních znaků například v populaci klientů banky. Ukážeme, jak odhadovat jednotlivé pravděpodobnosti realizace sle- dovaných znaků, k čemuž využijeme logaritmickou věrohodnostní funkci. Grafem podmíněných nezávislostí můžeme znázornit podmíněné nezávislosti diskrétně rozdělených náhodných veličin. Pomocí vyložené teorie, především použitím de- viance jako testové statistiky, můžeme zkoumat, jestli data odpovídají zvolenému grafickému modelu. Na konci práce aplikujeme teorii na reálná data a určíme gra- fický model, který nejlépe odpovídá závislostní struktuře v konkrétní bankovní databázi. Z příslušného grafu je možné vyvodit, jaké znaky jsou na sobě závislé a jaké naopak ne. Klíčová slova: logaritmicko - lineární rozvoj, grafický model,...Title: Dependence analysis of categorical data from banking Author: Miroslav Khýr Department: Department of Probability and Mathematical Statistics Supervisor: RNDr. Jitka Zichová, Dr., Department of Probability and Mathema- tical Statistics Abstract: The aim of this work is describing in detail the theory of the log - linear expansion and graphical models for random vectors with a discrete distribution. Such vector can be used for modeling categorical variables for example in a po- pulation of borrowers by a bank . We show how to estimate the probability of an individual category. We use a log - likelihood function. Independence graph can represent conditional independence of discretely distributed random variables. Using this theory, especially using deviance as test statistics, we can examine whether same data correspond to the selected graphical model. At the end of this work we apply the described theory to real data and determine the graphical mo- del best fitting the dependence structure in a database from banking. From this graph we can deduce which variables are dependent and which are independent. Keywords: Log - linear expansion, graphical model, log - likelihood function ,de- viance.