Národní úložiště šedé literatury Nalezeno 37 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Hodnocení Výsledků Fuzzy Shlukování
Říhová, Elena ; Pecáková, Iva (vedoucí práce) ; Řezanková, Hana (oponent) ; Žambochová, Marta (oponent)
Shluková analýza je vícerozměrná klasifikační statistická metoda zahrnující různé metody a postupy. Lze rozlišit pevné a fuzzy shlukování, kdy druhá varianta umožňuje přesnější výsledné rozdělení objektů do shluků. V reálném životě optimální počet těchto shluků není a prioriznám. A proto je zapotřebí tento optimální počet shluků zjistit, což umožnují koeficienty pro hodnocení výsledků shlukování. Těchto koeficientů však existuje velký počet. Jedním z cílů této disertační práce bylo vytvořit strukturovaný přehled existujících koeficientů a postupů určených pro hodnocení výsledků fuzzy shlukování v závislosti na optimálním počtu shluků. Hlavním cílem pak bylo navržení nového koeficientu pro hodnocení výsledků fuzzy shlukování, a to hlavně v případě velkého počtů shluků (více než pět). Nově navržený koeficient je založen na mírách příslušnosti a na vzdálenosti (euklidovská vzdálenost) mezi objekty, to znamená na principech fuzzy i pevného shlukování. Vhodnost použití vybraných koeficientů je zkoumána jednak na reálných, jednak na generovaných datových souborech, u kterých optimální počet shluků je známý. Použité datové soubory jsou různého rozsahu a obsahují různé počty proměnných a různé počty shluků. Cíle práce je možné považovat za splněné. Stěžejním přínosem této disertační práce je navržení nového koeficientu (E) pro hodnocení výsledků fuzzy shlukování, a to jak v případě souborů s malým, tak v případě souborů s velkým počtem shluků (více než pět). Díky tomu, že tento nový koeficient je založen na principech fuzzy i pevného shlukování, je schopen lépe než jiné koeficienty určit optimální počet shluků jak u malých, tak i u velkých datových souborů. Dalším přínosem práce je klasifikace již existujících koeficientů pro hodnocení výsledků fuzzy shlukování.
Building credit scoring models using selected statistical methods in R
Jánoš, Andrej ; Bašta, Milan (vedoucí práce) ; Pecáková, Iva (oponent)
Kredit skóring je ve finanční praxi důležitou a rychle se rozvíjející disciplínou. Cílem této práce je vytvořit souhrn základních metodik používaných k vytvoření a popisu kredit skóringových modelů s interpretací jejich výstupu společně s praktickou ilustrací postupu při vytváření těchto modelů v statistickém programovém prostředí R. Tato práce je členěná do pěti kapitol. První kapitola je věnovaná vysvětlení pojmu kredit skóring společně s několika příklady praktického využití a motivací pro jeho studium. V další části práce jsou postupně představené tři, ve finanční praxi nejčasteji používané, metody pro tvorbu kredit skóringových modelů. Ve druhé, nejrozvinutější kapitole se práce věnuje logistické regresi. Největší důraz je kladen na matematické odvození vztahu pro logistický regresní model a uvedeno je několik způsobů jako posoudit kvalitu proložení dat modelem. Dalšími dvěmi metodami prezentovanými v této práci jsou rozhodovací stromy a náhodné lesy, kterým se věnují kapitoly 3 a 4. Neoddělitelnou součástí této práce jsou podrobně popsané aplikace těchto metod na konkrétní datový soubor Default v programové platformě R. V závěrečné, páté, kapitole je praktická ilustrace vytvoření kredit skóringových modelů, jejich diagnostiky a následného vyhodnocení jejich schopnosti předpovídat selhání klienta v praxi s použitím R. V přílohách jsou uvedené vytvořené funkce a kód v R použité v práci. Čtenář vybavený základními poznatky z pravděpodobnosti a matematické statistiky získá dostatek teoretických znalostí a praktických zručností k pochopení modelů a jejich samostatné aplikaci.
Shluková a regresní analýza mikropanelových dat
Sobíšek, Lukáš ; Pecáková, Iva (vedoucí práce) ; Komárek, Arnošt (oponent) ; Brabec, Marek (oponent)
Panelové studie se provádí především za účelem analýzy změn hodnot sledovaných proměnných v čase. V mikropanelovém výzkumu se sleduje velké množství objektů periodicky během relativně krátkého časového úseku (v řádu let). Počet opakovaných měření je v řádu jednotek. Tato práce se věnuje stávajícím přístupům k regresní a shlukové analýze mikropanelových dat. Jedním z přístupů k analýze mikropanelu je využití modifikovaných vícerozměrných statistických modelů pro průřezová data, které zohledňují korelaci měření pro daný objekt. V práci jsou shrnuty dostupné nástroje pro regresní analýzu mikropanelových dat. Kromě rekapitulace známých a užívaných smíšených lineárních modelů pro normálně rozdělenou závisle proměnnou jsou stručně představeny nové přístupy pro analýzu vysvětlovaných proměnných s jiným než normálním rozdělením. Mezi ně patří například zobecněný lineární marginální model, zobecněný lineární model se smíšenými efekty a bayesovský přístup. Kromě popisu těchto modelů je uveden stručný přehled jejich implementace v systému R. S regresními modely upravenými pro mikropanelová data je spjato úskalí v nejednoznačnosti odhadu jejich parametrů. V práci je navrženo, jak zpřesnit odhady pomocí shlukové analýzy. Proto jsou v práci popsány metody shlukové analýzy mikropanelových dat. Vzhledem k tomu, že nabídka metod je omezená, hlavním cílem práce bylo navrhnout vlastní dvoukrokový postup shlukování mikropanelových dat. V prvním kroku jsou transformována panelová data na statická pomocí skupiny navržených charakteristik dynamiky, které reprezentují různé vlastnosti časového vývoje sledované proměnné. Ve druhém kroku jsou shlukovány objekty konvenčními prostorovými technikami (aglomerativní shlukování a metoda C-průměrů) na základě matice nepodobnosti hodnot shlukovacích proměnných spočítaných v prvním kroku. Dalším cílem práce je zjistit, zda navržený postup shlukování vede ke zkvalitnění regresních modelů pro tento typ dat. Pomocí simulační studie je porovnáván navržený shlukovací přístup s postupem aplikovaným v balíčku kml systému R a se shlukovacími charakteristikami, které navrhuje Urso (2004). V provedené studii dosáhla kombinace navržených shlukovacích proměnných lepších výsledků než používané skupiny shlukovacích proměnných. Dalším přínosem práce je skript napsaný pro jazyk R přiložený na CD. Tento skript je možno použít pro analýzu vlastních mikropanelových dat.
Analýza kontingenčních tabulek v dotazníkovém šetření řidičů
Velacková, Barbora ; Šulc, Zdeněk (vedoucí práce) ; Pecáková, Iva (oponent)
Bakalářská práce se zabývá analýzou dat z dotazníkového šetření řidičů pomocí kontingenčních tabulek. Data byla získána od výzkumné agentury Data Collect s.r.o., která provedla výzkum řidičů v roce 2014. Cílem práce je analyzovat chování řidičů a jejich návyky, které mohou zvyšovat riziko dopravních nehod. Práce je rozdělena do dvou hlavních částí, v první jsou popsány metody analýzy kontingenčních tabulek a ve druhé je samotná analýza dat. Nejprve je zkoumáno chování svobodných a mladých řidičů, v druhé části analýzy je porovnáváno chování mužů a žen za volantem. Výpočty byly provedeny ve statistickém programu SPSS a v tabulkovém procesoru MS Excel, kde byly vytvořeny také grafy a tabulky.
Hodnocení kvality dosaženého vzdělání jako faktoru uplatnitelnosti absolventů VŠE na trhu práce
Bezděk, Jaroslav ; Fischer, Jakub (vedoucí práce) ; Pecáková, Iva (oponent)
Tato bakalářská práce se zaměřuje na zkoumání hodnocení vysokoškolského vzdělání na Vysoké škole ekonomické v Praze s důrazem na Fakultu informatiky a statistiky. Cílem práce je ale především snaha o zjištění, zda některá položka z hodnocení vysokoškolského vzdělání může být považována za faktor uplatnitelnosti absolventů na pracovním trhu, a to až do pěti let po ukončení studia na vysoké škole. Analýza byla provedena nad daty z dotazníkového šetření REFLEX 2013. Zkoumání kvality vysokoškolského vzdělání bylo v práci prováděno pomocí četnostních tabulek a faktory uplatnitelnosti byly zkoumány na základě výpočtů měr závislosti nominálních a ordinálních proměnných. Přínos práce je především v možnosti reálného využití výsledků ke zkvalitnění úrovně vzdělávání na Vysoké škole ekonomické v Praze. Například bylo zjištěno, že studenti na Fakultě informatiky a statistiky za stávajících podmínek nedosahují takové míry vzdělání v oblasti komunikace v cizím jazyce, která by byla dostatečná pro přijetí do jejich současného zaměstnání.
Možnosti redukce výběrového zkreslení v ratingových modelech
Ditrich, Josef ; Hebák, Petr (vedoucí práce) ; Pecáková, Iva (oponent) ; Zamrazilová, Eva (oponent)
Využití ratingových modelů je dnes ve finančním sektoru již běžnou praxí. Oblast kredit skóringu představuje důležitou složku pro udržení ziskovosti i transparentnosti celého procesu poskytování úvěrů. Při objemech, s nimiž poskytovatelé úvěrů běžně pracují, představuje i nepatrné zlepšení diskriminační a predikční schopnosti používaných modelů významné dodatečné zisky. Přestože skóringové modely jsou aplikovány na celou populaci žadatelů o úvěr, jsou pro jejich tvorbu či úpravu stávajících rozhodovacích pravidel obvykle využívány pouze informace těch žadatelů, kterým byl úvěr poskytnut a bylo u nich tedy možné pozorovat platební disciplínu. Tento nesoulad vede ke zkreslení způsobeném zamítnutými žadateli, či obecněji k výběrovému zkreslení. Metody snažící se zmíněný jev odstranit či alespoň zmírnit se souhrnně označují pojmem reject inference. Tyto metody se snaží odhadnout chování zamítnutých žadatelů nebo o nich získat dodatečné informace. Disertační práce je věnována metodě otevřených dveří, která je založena na náhodném poskytování úvěrů i žadatelům, kteří by byli za normálních okolností zamítnuti. Jelikož je metoda náročná nejen časově, ale zejména finančně, zkoumal jsem způsoby, jak snížit náklady na pořízení dodatečných informací o zamítnutých žadatelích. Výsledkem je navržení její modifikace, kterou jsem pojmenoval metoda pootevřených dveří. Na reálné bankovní databázi jsem otestoval dvě možné třídící proměnné, které metoda vyžaduje a výsledky porovnal s původní verzí metody. Bylo ukázáno, že oba testované způsoby výběru žadatelů umožnily snížit nákladnost metody otevřených dveří při zachování vysoké přesnosti skóringových modelů.
Zkoumání závislosti materiální deprivace domácností ČR na vybraných faktorech
Cafourková, Magdalena ; Řezanková, Hana (vedoucí práce) ; Pecáková, Iva (oponent)
Cílem této diplomové práce je analýza materiální deprivace domácností vzhledem k vybraným ukazatelům, kterými jsou náklady na bydlení, kraj, ve které domácnost žije, počet členů a počet nezaopatřených dětí v domácnosti, věk a pohlaví osoby v čele, ekonomická aktivita a vzdělání členů domácnosti. Práce si klade za cíl nejen prokázat závislost mezi zvolenými ukazateli, ale také kvantifikovat tuto závislost pomocí poměru šancí. Závislost byla zkoumána jednak pomocí analýzy v kontingenční tabulce, ale také souhrnně pomocí logistické regrese. Byl prokázán individuální vliv všech proměnných s výjimkou počtu nezaopatřených dětí, žijících v domácnosti. Dále bylo prokázáno, že faktory vedoucí k ohrožení domácnosti mírou materiální deprivace se pro různé věkové skupiny liší. Pro všechny tyto věkové skupiny však platí, že na míru materiální deprivace má vliv pohlaví osoby v čele domácnosti, vzdělání členů domácnosti a náklady, které musí domácnost vynakládat na bydlení.
Metody analýzy vícerozměrných kontingenčních tabulek
Šulc, Zdeněk ; Pecáková, Iva (vedoucí práce) ; Coufalová, Petra (oponent)
Tato práce se zabývá vztahem dvou významných metod analýzy vícerozměrných kontingenčních tabulek, a sice korespondenční analýzou a loglineárními modely. Práce je rozdělena na tři celky. První je věnován základním pojmům kategoriální analýzy dat, především kontingenčním tabulkám a jejich rozdělením. Důraz je kladen zejména na jejich vícerozměrnou formu. Druhý celek představuje nástroje a techniky obou metod v rozsahu, jaký je nutný k jejich praktickému použití a interpretaci jejich výsledků. Praktická aplikace obou metod je obsažena v třetím celku, která je prezentována na datech z marketingového průzkumu. Tento celek popisuje nastavení obou analýz ve statistickém softwaru SPSS i následnou interpretaci jejich výstupů. V závěru práce jsou analyzované metody porovnávány z hlediska jejich použití.
Statistická analýza teplotních a srážkových časových řad v České republice v období 1961 - 2008
Helman, Karel ; Pecáková, Iva (vedoucí práce) ; Čermák, Václav (oponent) ; Žák, Michal (oponent)
Předkládaná disertační práce se zabývá analýzou měsíčních časových řad průměrných teplot a srážkových úhrnů naměřených na 44 místech v České republice v období 1961--2008. Hlavním cílem práce je s využitím sady vybraných statistických metod získat hlubší poznatky o zákonitostech vývoje klimatických časových řad. Sekundárním cílem je nalezení závislostí mezi dosaženými výsledky a základními geografickými souřadnicemi (nadmořskou výškou, zeměpisnou délkou a šířkou) vybraných měřicích stanic a porovnání všech výsledků pro dva klimatické prvky. Práce je přínosná ve dvou ohledech. Především uvádí řadu nových poznatků v oblasti klimatických časových řad, zejména v souvislosti se silou a vývojem jejich sezónní složky, ale také například popisuje vztah mezi rozdělením nesystematické složky a geografickými souřadnicemi měřicích stanic. Přínosem práce je rovněž rozsáhlá ukázka praktického využití řady statistických metod při analýze klimatických časových řad. Uplatněno bylo několik typů statistických metod -- od nástrojů v této oblasti hojně využívaných (analýza lineárních trendů) přes nástroje zřídka aplikované (Boxova-Jenkinsova metodologie) až po nástroje dosud nepoužité (časové řady klouzavé sezónnosti).
Vizualizace vícerozměrných statistických dat
Maroušek, Vít ; Pecáková, Iva (vedoucí práce) ; Černý, Jindřich (oponent)
Práce se zabývá možnostmi vizualizace vícerozměrných statistických dat. Protože se jedná o velmi širokou oblast, práce je rozčleněna do čtyř oddílů, z nichž dva jsou teoreticky a dva prakticky zaměřené. První z oddílů je věnován teoretickým aspektům vizualizace dat. Jsou v něm zpracovány informace o stavebních prvcích grafů a způsobu jak je zpracovává mozek v různých fázích vnímání. Druhý oddíl mapuje dostupné typy grafů, které lze využít k zobrazení dat. Detailně jsou zde popsány vybrané typy grafů pro spojitá a nespojitá vícerozměrná data. Třetí oddíl je zaměřený na dostupné programové prostředky k tvorbě grafů. V oddílu je popsáno více programů, z nichž jsou detailněji popsány programy STATISTICA, R a MS Excel. V posledním oddílu jsou poznatky získané v předchozích kapitolách dostatečným zdrojem informací pro provedení grafické analýzy vícerozměrných spojitých a nespojitých dat i pomocí pokročilejších analytických metod. Tato analýza je provedena zvlášť na datovém souboru se spojitými proměnnými a zvlášť na datovém souboru s nespojitými (kategoriálními) proměnnými.

Národní úložiště šedé literatury : Nalezeno 37 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.