Národní úložiště šedé literatury Nalezeno 10 záznamů.  Hledání trvalo 0.00 vteřin. 
Shlukování dat pomocí procedury MCluster-Miner systému LISp-Miner
Pelc, Tomáš ; Šimůnek, Milan (vedoucí práce) ; Šulc, Zdeněk (oponent)
Bakalářská práce se zabývá shlukováním dat pomocí procedury MCluster-Miner systému LISp-Miner. Prvním cílem práce je shluková analýza dat pomocí zmíněné procedury a posouzení možností jejího využití na různých datových sadách. Pro dosažení tohoto cíle práce je prakticky aplikována daná procedura na šesti datových sadách. Druhým cílem práce je rozebrat možnosti implementovaných algoritmů, měr podobnosti a navrhnout doporučení pro volbu parametrů úlohy shlukování. K splnění tohoto cíle jsou dostupné algoritmy a míry podobnosti porovnány podle dosažených výsledků (kvalita rozdělení objektů do shluků, čas úlohy, počet atributů použi-tých pro shlukování). Následně jsou z těchto porovnání odvozena doporučení pro volbu parame-trů úlohy shlukování. Přínosem práce jsou tyto doporučení, porovnání dostupných algoritmů a měr podobnosti, shrnutí aktuálního stavu (ke květnu 2017) modulu MCluster-Miner a ukázání možnosti zobrazení výsledků shlukovací úlohy na interaktivní analýze geografických dat. V teo-retické části práce je popsán systém LISp-Miner, základní principy shlukování, způsoby shluková-ní a míry podobnosti, které využívá GUHA-procedura MCluster-Miner, a modul MCluster-Miner. V praktické části je aplikována procedura MCluster-Miner na šesti různých datových sadách a jsou zde shrnuty dosažené výsledky.
Analysis of a questionnaire survey of graduates of the master degree at the University of Economics Prague
Barus, Miroslav ; Šulc, Zdeněk (vedoucí práce) ; Blatná, Dagmar (oponent)
Bakalářská práce se zabývá analýzou dat z dotazníkového šetření absolventů magisterského stupně studia na Vysoké školy ekonomické v Praze. Data byly získány z dotazníku výzkumného projektu Reflex 2010 pod záštitou Střediska vzdělávací politiky, Univerzity Karlovy v Praze. Cílem práce je komparace uplatnění absolventů podle různých ukazatelů. Práce je členěna do dvou částí. První se zabývá teoretickým vymezením a deskripciou testů porovnávajících střední hodnotu a relativní četnost zkoumaných znaků, využitých při analýze. Druhá část analyzuje a porovnává uplatnění absolventů rozdělených podle fakult, pohlaví a místa uplatnění. Záměrem práce je i zhodnocení dopadu použití nevalidní testů hypotéz.
Popisná statistika v R s aplikací na reálná data
Pirohová, Eva ; Bašta, Milan (vedoucí práce) ; Šulc, Zdeněk (oponent)
Cílem práce je představit možnosti popisné statistiky ve statistickém softwaru R a vysvětlit princip zadávání příkazů a funkcí v tomto softwaru. V teoretické části práce bude uživatel seznámen s informacemi, co je to popisná statistika a na jakém principu funguje software R. Důležitou součástí jsou uvedené funkce a kódy, které se zadávají do příkazového řádku či skriptu v R. Praktická část obsahuje aplikaci principů popisné statistika a příslušných příkazů a funkcí v R na reálná data včetně ilustrací v podobě jednotlivých typů grafů. Pod každou konkrétní mírou popisné statistiky či grafickým výstupem bude uveden příkaz v podobě funkce v R s vysvětleným postupem a komentářem. Práce obsahuje vše podstatné, co by měl znát každý, kdo se statistikou a s prací v R začíná. I přes to, že je práce s R pro ty, kteří neprogramují, ze začátku složitá, bude práce koncipována tak, aby i začátečník byl schopen analyzovat data z hlediska popisné statistiky.
Statistické metody ve stylometrii
Dupal, Pavel ; Kaspříková, Nikola (vedoucí práce) ; Šulc, Zdeněk (oponent)
Cílem této práce je podat přehled nejpoužívanějších metod v odvětví identifikace autorského stylu (stylometrii). Úvodem je zrekapitulována historie tohoto oboru od konce 19. století do současnosti a je uvedena a vysvětlena potřebná terminologie z oblasti dolování znalostí z textu. Následuje představení několika vybraných metod z oblasti vícerozměrné statistiky (např. metoda hlavních komponent, shluková analýza) a strojového učení (Support Vector Machines, Naive Bayes) a jejich aplikace na stylometrické problémy, včetně několika metod vytvořených specificky pro použití v této oblasti (bootstrap consensus tree, kontrastní analýza). Nakonec jsou tyto metody aplikovány na praktický příklad verifikace autorství založeném na korpusu sestaveném z děl čtyř internetových spisovatelů.
Míry podobnosti pro nominální data v hierarchickém shlukování
Šulc, Zdeněk ; Řezanková, Hana (vedoucí práce) ; Šimůnek, Milan (oponent) ; Žambochová, Marta (oponent)
Tato disertační práce se zabývá mírami podobnosti pro nominální data v hierarchickém shlukování, které umožňují zacházet s proměnnými s více než dvěma kategoriemi a které si kladou za cíl nahradit postupy založené na koeficientu prosté shody, které se v této oblasti běžně používají. Tyto míry podobnosti uvažují dodatečné informace ohledně datového souboru, jako je rozdělení četností kategorií u dané proměnné nebo počet jejích kategorií. Tato práce se věnuje třem hlavním cílům. Prvním cílem je prozkoumání a ohodnocení kvality shlukování vybraných měr podobnosti pro hierarchické shlukování objektů a proměnných. K dosažení tohoto cíle bylo provedeno několik experimentů, které se zabývají jak shlukováním objektů, tak proměnných. Tyto experimenty zkoumají kvalitu shluků vytvořených za pomocí zkoumaných měr podobnosti pro nominální data ve srovnání běžně používanými mírami podobnostmi využívajícími binární transformaci a dále s několika alternativními metodami pro shlukování nominálních dat. Toto porovnání je provedeno na reálných i generovaných souborech. Výstupy těchto experimentů vedou ke zjištění, které míry podobnosti jsou vhodné k obecnému použití, které podávají dobré výsledky v konktrétních situacích a které nejsou doporučeny pro shlukování objektů nebo proměnných. Druhým cílem práce je navržení míry podobnosti vycházející z teoretických předpokladů a její následné porovnání s ostatními zkoumanými mírami podobnosti. Na základě tohoto cíle byly představeny dvě nové míry podobnosti, Variable Entropy a Variable Mutability. Obzvláště prvně zmíněná míra podává velmi dobré výsledky u souborů s nižším počtem proměnných. Třetím cílem této práce je poskytnout komfortní sofwarové řešení založené na zkoumaných mírách podobnosti pro nominální data, které pokrývá celý proces shlukování od výpočtu matice vzdálenosti po hodnocení výsledných shluků. Tento cíl byl dosažen vytvořením balíčku nomclust pro program R, který řeší tuto problematiku a který je volně dostupný.
Shluková analýza jako nástroj klasifikace objektů
Budilová, Šárka ; Löster, Tomáš (vedoucí práce) ; Šulc, Zdeněk (oponent)
Shluková analýza dat je oblíbená klasifikační metoda vícerozměrné statistiky. Pomocí této metody lze klasifikovat zkoumané objekty na základě jejich vzájemných podobností, tj. rozdělit je do několika skupin, respektive shluků. Výsledky shlukování mohou být při zvolení různých metod, měr vzdáleností a postupů odlišné. Cílem této diplomové práce je srovnání úspěšnosti zařazení objektů do známých klasifikačních tříd v rámci zvolených metod a postupů. Celkem bylo analyzováno 15 různých datových souborů, z nichž každý obsahoval známou informaci o zařazení objektů do skupin. Úspěšnost zařazení dané metody byla vypočtena na základě porovnání známých klasifikačních tříd a vzniklých shluků. Kromě porovnání úspěšnosti vybraných metod shlukové analýzy byl v rámci každé metody zkoumán vliv standardizace a korelace na úspěšnost zařazení jednotlivých objektů. Pro vyjádření vzdálenosti mezi objekty byla využita euklidovská čtvercová vzdálenost. Výsledky práce poukazují na lepší úspěšnost zařazování objektů v případě zachování korelovaných proměnných v datovém souboru. Před standardizací zařadily metody v průměru 69,8 % objektů a po standardizaci 70,8 % objektů do správných klasifikačních tříd. Úspěšnost zařazení byla v průměru o dva procentní body vyšší než v případě vypuštění korelovaných proměnných. Výsledky dále také ukazují značnou důležitost standardizace v případě Wardovy metody. Po provedené standardizaci datového souboru je Wardova metoda v průměru o devět procentních bodů úspěšnější a zařazuje do správných klasifikačních tříd nejvíce objektů. Při zachování korelovaných proměnných a po standardizaci dat činí úspěšnost této metody 76,4 %. Standardizace pozitivně ovlivňuje také centroidní metodu a metodu nejvzdálenějšího souseda. Při ponechání původních, nestejnoměrných proměnných zařazují objekty naopak lépe mediánová metoda, metoda nejbližšího souseda a metoda průměrné vazby.
Analýza kontingenčních tabulek v dotazníkovém šetření řidičů
Velacková, Barbora ; Šulc, Zdeněk (vedoucí práce) ; Pecáková, Iva (oponent)
Bakalářská práce se zabývá analýzou dat z dotazníkového šetření řidičů pomocí kontingenčních tabulek. Data byla získána od výzkumné agentury Data Collect s.r.o., která provedla výzkum řidičů v roce 2014. Cílem práce je analyzovat chování řidičů a jejich návyky, které mohou zvyšovat riziko dopravních nehod. Práce je rozdělena do dvou hlavních částí, v první jsou popsány metody analýzy kontingenčních tabulek a ve druhé je samotná analýza dat. Nejprve je zkoumáno chování svobodných a mladých řidičů, v druhé části analýzy je porovnáváno chování mužů a žen za volantem. Výpočty byly provedeny ve statistickém programu SPSS a v tabulkovém procesoru MS Excel, kde byly vytvořeny také grafy a tabulky.
Analýza podobnosti hodnot Indexu lidského rozvoje mezi evropskými státy
Šafaříková, Kristýna ; Malá, Ivana (vedoucí práce) ; Šulc, Zdeněk (oponent)
Cílem této diplomové práce je čtenáři přiblížit problematiku indexu lidského rozvoje v evropských zemích a provést shlukovou analýzu nejen indexu lidského rozvoje evropských zemí, ale i dalších pojmů souvisejících s kvalitou života a najít pomocí hierarchických metod podobnost mezi jednotlivými státy. První část práce je zaměřena na definici kvality života a indexu lidského rozvoje, pomocí kterého je možné měřit kvalitu života. V práci jsou uváděny i další způsoby, kterými lze zkoumat kvalitu života. Druhá část práce je zaměřena na definici shlukové analýzy, která je využita pro hledání podobnosti mezi jednotlivými státy. K zařazení států do shluků je použito pět hierarchických metod shlukování. K vyjádření vzdálenosti mezi jednotlivými státy je použita čtvercová Eukleidovská vzdálenost. Podobnost mezi státy je posuzována na základě rozřazení do shluků pomocí jednotlivých metod. Diplomová práce ukazuje podobnost mezi evropskými státy z hlediska kvality života a poskytuje statistický pohled na toto téma. Výsledky práce ve většině případů poukazují na podobnost geograficky blízkých států.
Metody analýzy vícerozměrných kontingenčních tabulek
Šulc, Zdeněk ; Pecáková, Iva (vedoucí práce) ; Coufalová, Petra (oponent)
Tato práce se zabývá vztahem dvou významných metod analýzy vícerozměrných kontingenčních tabulek, a sice korespondenční analýzou a loglineárními modely. Práce je rozdělena na tři celky. První je věnován základním pojmům kategoriální analýzy dat, především kontingenčním tabulkám a jejich rozdělením. Důraz je kladen zejména na jejich vícerozměrnou formu. Druhý celek představuje nástroje a techniky obou metod v rozsahu, jaký je nutný k jejich praktickému použití a interpretaci jejich výsledků. Praktická aplikace obou metod je obsažena v třetím celku, která je prezentována na datech z marketingového průzkumu. Tento celek popisuje nastavení obou analýz ve statistickém softwaru SPSS i následnou interpretaci jejich výstupů. V závěru práce jsou analyzované metody porovnávány z hlediska jejich použití.
Analýza výsledků studentů předmětu 4ST201
Šulc, Zdeněk ; Malá, Ivana (vedoucí práce) ; Helman, Karel (oponent)
Hlavním cílem této bakalářské práce je porovnání a testování výsledků studentů, kteří navštěvovali kurz statistiky na VŠE v Praze. Práce je rozdělena na teoretickou a praktickou část. Teoretická část vysvětluje základní metody, které jsou použity v práci. Praktická část se zabývá vlastní analýzou, která je hlavně zaměřena na průběžné testy během semestru. Výsledky této práce jsou shrnuty v závěru.

Viz též: podobná jména autorů
1 Šulc, Zbyněk
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.