Shlukovací metody pro velké soubory dat

Vilikus, Ondřej

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Vysokoškolské kvalifikační práce > Diplomové práce > Shlukovací metody pro velké soubory dat

Název: Shlukovací metody pro velké soubory dat
Překlad názvu: Clustering methods for large datasets
Autoři: Vilikus, Ondřej ; Fialová, Hana (vedoucí práce) ; Húsek, Dušan (oponent)
Typ dokumentu: Diplomové práce
Rok: 2007
Jazyk: cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: S rostoucím množstvím shromažďovaných a ukládaných dat vzniká potřeba shlukovacích metod, které by se dokázaly vypořádat i s rozsáhlými datovými soubory. Proto se objevuje množství nových algoritmů, vycházejících jak ze statistických přístupů, tak i z oblasti strojového učení. Cílem této diplomové práce je stručně představit dostupné metody shlukové analýzy a zhodnotit jejich silné a slabé stránky při analýze velkých souborů. Obsahem teoretické části je shrnutí základních pojmů a principů, které jsou všem metodám společné, a popisu nejznámějších metod shlukové analýzy. Ten obsahuje stručné vysvětlení, na jakém principu fungují a jaké výhody nebo případné nedostatky můžeme při jejich použití očekávat. Praktická část práce je věnována vlastnímu testování osmi metod dostupných v komerčním (SPSS, S-PLUS, STATISTICA) nebo akademickém (Weka) softwaru. Pro testování jsou použity umělé soubory se specifickými charakteristikami, které jsem vygeneroval pomocí vlastního algoritmu. Ten je rozšířením Neyman-Scottova procesu a kromě sférických shluků generuje i shluky nepravidelných tvarů. Výsledky potvrzují očekávání vycházející z teoretických předpokladů. Přinášejí však možnost kvantifikace vlivu charakteru dat na vhodnost jednotlivých metod.
Klíčová slova: algoritmy; generování náhodných souborů; shluková analýza; statistický software; velké datové soubory

Instituce: Vysoká škola ekonomická v Praze (web)
Informace o dostupnosti dokumentu: Dostupné v digitálním repozitáři VŠE.
Původní záznam: http://www.vse.cz/vskp/eid/2833

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-4408

Záznam je zařazen do těchto sbírek:
Školství > Veřejné vysoké školy > Vysoká škola ekonomická v Praze
Vysokoškolské kvalifikační práce > Diplomové práce

Záznam vytvořen dne 2011-07-01, naposledy upraven 2022-03-03.

Podobné záznamy

Není přiložen dokument

Exportovat ve formátu DC, NUŠL, RIS
Sdílet

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English