Národní úložiště šedé literatury Nalezeno 3 záznamů.  Hledání trvalo 0.00 vteřin. 
Hodnocení Výsledků Fuzzy Shlukování
Říhová, Elena ; Pecáková, Iva (vedoucí práce) ; Řezanková, Hana (oponent) ; Žambochová, Marta (oponent)
Shluková analýza je vícerozměrná klasifikační statistická metoda zahrnující různé metody a postupy. Lze rozlišit pevné a fuzzy shlukování, kdy druhá varianta umožňuje přesnější výsledné rozdělení objektů do shluků. V reálném životě optimální počet těchto shluků není a prioriznám. A proto je zapotřebí tento optimální počet shluků zjistit, což umožnují koeficienty pro hodnocení výsledků shlukování. Těchto koeficientů však existuje velký počet. Jedním z cílů této disertační práce bylo vytvořit strukturovaný přehled existujících koeficientů a postupů určených pro hodnocení výsledků fuzzy shlukování v závislosti na optimálním počtu shluků. Hlavním cílem pak bylo navržení nového koeficientu pro hodnocení výsledků fuzzy shlukování, a to hlavně v případě velkého počtů shluků (více než pět). Nově navržený koeficient je založen na mírách příslušnosti a na vzdálenosti (euklidovská vzdálenost) mezi objekty, to znamená na principech fuzzy i pevného shlukování. Vhodnost použití vybraných koeficientů je zkoumána jednak na reálných, jednak na generovaných datových souborech, u kterých optimální počet shluků je známý. Použité datové soubory jsou různého rozsahu a obsahují různé počty proměnných a různé počty shluků. Cíle práce je možné považovat za splněné. Stěžejním přínosem této disertační práce je navržení nového koeficientu (E) pro hodnocení výsledků fuzzy shlukování, a to jak v případě souborů s malým, tak v případě souborů s velkým počtem shluků (více než pět). Díky tomu, že tento nový koeficient je založen na principech fuzzy i pevného shlukování, je schopen lépe než jiné koeficienty určit optimální počet shluků jak u malých, tak i u velkých datových souborů. Dalším přínosem práce je klasifikace již existujících koeficientů pro hodnocení výsledků fuzzy shlukování.
Míry podobnosti pro nominální data v hierarchickém shlukování
Šulc, Zdeněk ; Řezanková, Hana (vedoucí práce) ; Šimůnek, Milan (oponent) ; Žambochová, Marta (oponent)
Tato disertační práce se zabývá mírami podobnosti pro nominální data v hierarchickém shlukování, které umožňují zacházet s proměnnými s více než dvěma kategoriemi a které si kladou za cíl nahradit postupy založené na koeficientu prosté shody, které se v této oblasti běžně používají. Tyto míry podobnosti uvažují dodatečné informace ohledně datového souboru, jako je rozdělení četností kategorií u dané proměnné nebo počet jejích kategorií. Tato práce se věnuje třem hlavním cílům. Prvním cílem je prozkoumání a ohodnocení kvality shlukování vybraných měr podobnosti pro hierarchické shlukování objektů a proměnných. K dosažení tohoto cíle bylo provedeno několik experimentů, které se zabývají jak shlukováním objektů, tak proměnných. Tyto experimenty zkoumají kvalitu shluků vytvořených za pomocí zkoumaných měr podobnosti pro nominální data ve srovnání běžně používanými mírami podobnostmi využívajícími binární transformaci a dále s několika alternativními metodami pro shlukování nominálních dat. Toto porovnání je provedeno na reálných i generovaných souborech. Výstupy těchto experimentů vedou ke zjištění, které míry podobnosti jsou vhodné k obecnému použití, které podávají dobré výsledky v konktrétních situacích a které nejsou doporučeny pro shlukování objektů nebo proměnných. Druhým cílem práce je navržení míry podobnosti vycházející z teoretických předpokladů a její následné porovnání s ostatními zkoumanými mírami podobnosti. Na základě tohoto cíle byly představeny dvě nové míry podobnosti, Variable Entropy a Variable Mutability. Obzvláště prvně zmíněná míra podává velmi dobré výsledky u souborů s nižším počtem proměnných. Třetím cílem této práce je poskytnout komfortní sofwarové řešení založené na zkoumaných mírách podobnosti pro nominální data, které pokrývá celý proces shlukování od výpočtu matice vzdálenosti po hodnocení výsledných shluků. Tento cíl byl dosažen vytvořením balíčku nomclust pro program R, který řeší tuto problematiku a který je volně dostupný.
Shluková analýza rozsáhlých souborů dat: nové postupy založené na metodě k-průměrů
Žambochová, Marta ; Řezanková, Hana (vedoucí práce) ; Húsek, Dušan (oponent) ; Antoch, Jaromír (oponent)
Abstrakt Shluková analýza se stala jedním z hlavních nástrojů používaných při získávání znalostí z dat, které je označováno jako data mining. V této nové oblasti analýzy dat se často zpracovávají datové soubory velkých rozměrů, a to jak co do počtu sledovaných objektů, tak co do počtu proměnných, kterými jsou objekty charakterizovány. Pro shlukování dat bylo vyvinuto mnoho metod. Jednou z často používaných technik je metoda k-průměrů. Jejím základem je hledání nejlepšího přiřazení objektů do shluků na principu inicializačního rozdělení objektů a následného postupného přerozdělování s využitím optimalizační funkce. Cílem této disertační práce bylo jednak porovnání vybraných existujících variant metody k-průměrů, detailní charakteristika jejich pozitivních a negativních vlastností, jednak návrh nových modifikací této metody a jejich experimentální srovnání s již existujícími přístupy. Tyto cíle byly splněny. Ve své práci jsem se zaměřila na modifikace metod k-průměrů pro shlukování velkého počtu objektů, konkrétně na algoritmy BIRCH k-průměrů, filtrovací, dvou- fázový a k-průměrů++. Experimentálně jsem sledovala časovou náročnost jednotlivých algoritmů, vliv inicializačních rozdělení, vliv odlehlých objektů a validitu výsledných shluků. Při experimentech byly použity dva reálné datové soubory a dále několik souborů generovaných. V závěru práce jsou shrnuty společné a rozdílné rysy zkoumaných variant metody k-průměrů s důrazem na výše uvedená hlediska. Přínosem práce je tedy kromě zhodnocení současných variant metody k-průměrů především návrh výše uvedených nových modifikací, jejich naprogramování a experi- mentální ověření. Modifikace přinesly zejména urychlení výpočtu způsobené zjedno- dušením práce s účelovou funkcí a kritérií ukončení programu. Aplikování hlavní myšlenky algoritmu k-průměrů++ do jiných variant metody k-průměrů přineslo lepší vý-sledky shlukování z hlediska variability. Nejzásadnější z navržených změn je modifi-kace filtrovacího algoritmu, která přináší zcela novou vlastnost této metody, a to odhalení odlehlých objektů. Součástí práce je CD, které obsahuje zdrojové kódy jednotlivých programů vytvořených ve vývojovém prostředí MATLAB. Programy byly vytvořeny speciálně pro účely této práce a jsou určeny pro experimentální použití. CD také obsahuje datové soubory využívané k jednotlivým pokusům.