|
Využití klasifikačních stromů v marketingovém průzkumu trhu
PROKOPOVÁ, Kateřina
Ve své diplomové práci jsem se zabývala využitím klasifikačních stromů v marketingovém průzkumu trhu, přičemž jsem se zaměřila na oblast poskytování mobilních služeb. Cílem mé práce bylo pomocí progresivní metodologie CART (klasifikační a regresní stromy) identifikovat důležité faktory ovlivňující chování zákazníka. Na základě dotazníkového šetření jsem dospěla k závěrům, že zákazníci jsou při výběru mobilního operátora ovlivněni jejich čistým měsíčním příjmem, věkem, povoláním, službami, které nejvíce využívají a tím, zda využívají mobilního operátora pro osobní či firemní účely.
|
|
Statistické klasifikační metody
Barvenčík, Oldřich ; Žák, Libor (oponent) ; Michálek, Jaroslav (vedoucí práce)
Práce se zabývá vybranými klasifikačními metodami. Jsou zde popsány základy shlukové analýzy, diskriminační analýzy a teorie klasifikačních stromů. Použití metod je ukázáno při klasifikaci simulovaných dat, výpočet je proveden v programu STATISTICA. V praktické části práce pak následuje porovnání metod při klasifikaci reálných datových souborů různých rozsahů. Klasifikačními metodami je také řešena reálná úloha – predikce znečištení ovzduší na základě předpovědi počasí.
|
|
Srovnání diskriminační analýzy a klasifikačních stromů
Dlabač, Jaroslav ; Vilikus, Ondřej (vedoucí práce) ; Stecenková, Marina (oponent)
Tato bakalářská práce porovnává dvě metody na diskriminaci a klasifikaci dat ve vícerozměrné statistické analýze. Zatímco diskriminační analýza zastupuje klasickou statistickou metodu na diskriminaci a následnou klasifikaci dat, metoda CART představuje nový postup v data-minigu, který využívá umělou inteligenci. První polovina této práce je věnována teoretickému popisu a srovnání těchto dvou metod. Její druhá polovina už je demonstrací obou metod na praktickém příkladu. Na závěr jsou výsledky obou těchto metod srovnány a zhodnoceny.
|
|
Vliv operátora na přesnost odhadu podílu masa u prasat
Jiravová, Renata ; Šprysl, Michal (vedoucí práce) ; Libor , Libor (oponent)
Cíl práce sledoval určení chyby operátora, tedy opakovatelnosti, respektive vlivu místa měření na přesnost odhadu podílu masa. Šlo o to přístrojem FOM-SFK změřit v předepsaných místech na JUT prasat výšku tuku, svalu a tím i zmasilosti při jejich realizaci v systému SEUROP. Za tímto účelem bylo celkem změřeno 71 hybridních prasat (Dan-Bred) na běžném příhonu jatek ve Velvarech. Měření se prováděno vždy na jednom zvířeti, a to šesti následujícími klasifikačními vpichy, a to 1. mezi 2. a 3. posledním žebrem 7 cm laterálně od středu páteře (správný vpich), 2. mezi 2. a 3. posledním žebrem 7 cm laterálně od středu páteře (opakovaný vpich do správného vpichu), 3. mezi 1. a 2. posledním žebrem 1 cm kaudálně od správného vpichu, 4. mezi 3. a 4. posledním žebrem 1 cm kraniálně od správného vpichu, 5. mezi 2. a 3. posledním žebrem 1 cm mediálně od správného vpichu, 6. mezi 2. a 3. posledním žebrem 1 cm laterálně od správného vpichu, Měření bylo provedeno na JUT s tím, že vpich 2 by se měl shodovat s vpichem 1, vpichy 3 a 4 byly posunuty o 1 žebro kaudálně, resp. kraniálně oproti vpichu 1 a vpichy 5 a 6 byly posunuty o 1 cm mediálně, resp. laterálně oproti vpichu 1. Klasifikace se uskutečnila přístrojovou technikou FOM a pro další porovnání i metodou ZP. Pro uvedené klasifikace prasat bylo použito regresních rovnic tvaru pro: - FOM y=81,8909+0,2006*M+14,1911*ln S, kde M=výška svalu MLLT a S=výška tuku, - ZP y=76,6722--1,0485*M+0,00794*M2--0,002884*S2+9,0151*ln (M/S), kde M = hloubka svalu MLLT a S =výška tuku. Výpočet a porovnání výsledků bylo provedeno matematicko-statistickým programem SAS Propriety Software Release 6.04, rozdíly pak byly testovány analýzou variance. Na základě zjištěných výsledků lze konstatovat, že daná hypotéza byla potvrzena. Rovněž při realizaci jatečných prasat v systému SEUROP lze konstatovat, že - invazní technikou FOM - přesné určení odhadu zmasilosti JUT je funkcí nutnosti přesného určení místa vpichu operátorem, - přesnost odhadu výšky tuku a podílu svaloviny je ovlivněna opakovanými vpichy, - spolehlivěji se při opakovaném vpichu měří výška tuku, než výška svaloviny, a to v důsledku její možné deformace, - nepřesnost opakovaného měření (opakovatelnost) významně neovlivní zařazení JUT do klasifikačních tříd v běžném provozu jatek, případné chyby se projeví v neprospěch dodavatele, - posun vpichu o 1 žebro kraniálním, resp. kaudálním směrem ovlivní výslednou klasifikaci JUT více, než posun vpichu o 1 cm mediálně či laterálně od páteře, - v případě neúspěšného měření je nejlépe vpich opakovat, či druhý vpich posunout 1 cm kaudálně či, opakovat vpich mezi 2. a 3. hrudním obratlem 1cm ve směru k páteři, - neinvazní technikou ZP dochází, oproti FOM, k podhodnocení zmasilosti, a to cca o 1,4%.
|
|
Classification and Regression Trees in R
Nemčíková, Lucia ; Bašta, Milan (vedoucí práce) ; Vilikus, Ondřej (oponent)
Rozhodovací stromy tvoří v dnešní době užitečný doplněk ke klasickým metodám pro řešení klasifikačních a regresních problémů. Hlavním cílem této práce není rozhodnout, který přístup je lepší, ale přinést čtenáři přehled těchto metod a aplikovat je na skutečná data s pomocí statistického jazyka R. Práce se soustřeďuje na základní metodiku rozhodovacích stromů, ale především na aplikaci těchto metod, tak aby poskytla čtenáři co nejširší přehled dostupných nástrojů a znalost aby byl schopen tyto metody reálně používat. Poslední část práce se dotkne pokročilých metod pro vylepšení modelů rozhodovacích stromů, aby byl poskytnut ucelený obraz možností.
|
| |
|
Ekonometrický odhad očekávané úvěrové ztráty při selhání
Jacina, Viktor ; Dlouhá, Zuzana (vedoucí práce) ; Formánek, Tomáš (oponent)
Jedním z nejčastěji zmiňovaných parametrů úvěrového rizika bankovního sektoru je ztrátovost ze selhání (LGD). Regulatorní rámec dovoluje po schválení použití vlastních odhadů tohoto parametru. Vhodnou a flexibilní metodu představují v tomto kontextu regresní a klasifikační stromy, které nabízejí řadu výhod oproti tradičním metodám jako např. lineárnímu regresnímu modelu. Tato práce obsahuje stručný teoretický základ stromových technik. V poslední části je odhadnuta ztrátovost ze selhání debetních úvěrů pomocí náhodných lesů, které se v tomto případě ukázaly jako nejúspěšnější.
|
|
Využití Bayesovských sítí pro predikci korporátních bankrotů
Hátle, Lukáš ; Witzany, Jiří (vedoucí práce) ; Málek, Jiří (oponent)
Cílem práce je zhodnotit použití bayesovských klasifikátorů v predikci korporátních bankrotů. Získané výsledky naznačují, že bayesovské klasifikátory dosahují srovnatelných výsledků s častěji používanými metodami v této oblasti, jako jsou logistická regrese a rozhodovací stromy. Srovnání bylo provedeno na základě vlastní analýzy na datových souborech z České republiky a Polska. Celková úspěšnost naivních bayesovských klasifikátorů používajících entropickou diskretizaci s hybridním předvýběrem vysvětlujících atributů je pro český datový soubor 77,19 %, pro polský 79,63 %. Hodnoty AUC jsou pro příslušné datové soubory 0,81 a 0.87. Dosažené výsledky na polském datovém souboru byly porovnány s již publikovanými články od Tsaie (2009) a Wanga et al. (2014), které aplikují jiné klasifikační algoritmy na stejný datový soubor. Navrhované metody v této práci vycházejí ze srovnání velice úspěšně. Práce dále nabízí srovnání jednotlivých přístupů k diskretizaci numerických atributů a výběru relevantních vysvětlujících atributů. Tyto oblasti se ukazují pro zvýšení výkonnosti naivního bayesovského klasifikátoru jako klíčové.
|
|
Srovnání vybraných klasifikačních metod pro vícerozměrná data
Stecenková, Marina ; Řezanková, Hana (vedoucí práce) ; Berka, Petr (oponent)
Cílem této diplomové práce je srovnání vybraných klasifikačních metod, a to logistické regrese (binární a multinomické), vícevrstvého perceptronu a klasifikačních stromů CHAID a CRT. V první části je připomenut teoretický základ těchto metod a vysvětlena podstata parametrů modelu. V další části jsou na šesti datových souborech aplikovány výše uvedené klasifikační metody a následně porovnány výstupy těchto metod. Důraz je kladen zejména na hodnocení diskriminační síly modelů. Této problematice je věnována samostatná kapitola. Hodnocení diskriminační síly modelu je založeno na celkové úspěšnosti, F-míře a velikosti plochy pod ROC křivkou. Přínosem práce není pouze srovnání vybraných klasifikačních metod na základě statistik hodnotících diskriminační sílu modelů, ale také celkový přehled o přednostech a nedostatcích jednotlivých metod.
|
|
Tvorba soustav ukazatelů - bankrotních modelů
BÜRGER, Pavel
V práci je řešen komplexní proces tvorby nového bankrotního modelu pro předpověď úpadku podniku, přičemž tento proces zahrnuje výběr kvalitního vzorku podniků, ověření klasifikační přesnosti již existujících bankrotních modelů, profilovou analýzu a vlastní tvorbu konkrétní rovnice bankrotního modelu, která je provedena pomocí dvou vybraných statistických metod, diskriminační analýzy a logistické regrese. Pomocí zvolených statistických metod byly vytvořeny dva bankrotní modely Bürgerův index DA12 a Bürgerův index LR12. Jejich nespornou výhodou, na rozdíl od již existujících a známých bankrotních modelů, je zaměření na klasifikaci malých a mikro podniků v podmínkách České republiky, přičemž klasifikační přesnost jeden rok před úpadkem je u jednotlivých modelů 74,8 % a 81,87 %. Vytvořené modely mají jednoznačnou interpretaci (žádná šedá zóna) a snadný výpočet, tím přinášejí mikro a malým podnikatelům možnost prověřovat své obchodní partnery z hlediska predikce úpadku.
|