National Repository of Grey Literature 62 records found  beginprevious53 - 62  jump to record: Search took 0.00 seconds. 
Shlukování jako nástroj pro data mining
Řezanková, H. ; Húsek, Dušan ; Snášel, Václav
Different clustering algorithms are reviewed, including neural network based. Special attention is given to this supporting large data sets analysis, including incremental ones.
Information Retrieval and Graph Web Structures
Húsek, Dušan ; Řezanková, H. ; Snášel, Václav
The analysis of the hyperlinks on the Web can significantly increase the capability of search engines. In the paper we deal with experiments with graph structure of the Web especially 2-conected components.
Zjišťování skupin podobných proměnných v systémech SAS a SPSS
Marková, Monika ; Řezanková, Hana (advisor) ; Húsek, Dušan (referee)
My diploma thesis focuses on the comparison of possibilities of the statistical software SAS and SPSS in the area of the factor and cluster analysis and the multidimensional scaling. They deal with the methods for identifying groups of the similar statistical values (variables). The ascertained relations among the variables can serve to decrease the proportion vectors of the variables, which describe the individual monitored objects (statistical units), which helps us to apply other various methods, for example the regression or discriminant analysis. By one of the ways for finding the similarity of variables in the cluster analysis or the multidimensional scaling is searching for their relations. Whereas the base of the factor analysis is the formulation of the relation between two variables by means of the covariances, eventually Pearson correlation coefficient, it is possible to use also coefficients of correlation for the cluster analysis and the multidimensional scaling, in some case other measures. The thesis describes mainly the command syntax of the procedures implemented in SAS and SPSS. The meaning of the individual parametres and the partial specifications of each command are explained. The results gained by various types of analyses are compared on the basis of the real dataset. The possibilities of the statistical software SAS and SPSS are evaluated in the conclusion and it is referred to their advantages or disadvantages. The attention is also paid, for example, to the form of the input dataset, to the quaility of outputs or to the partial methods.
Aplikace shlukové analýzy v modelech životního pojištení
Peřina, Milan ; Řezanková, Hana (advisor) ; Húsek, Dušan (referee)
Vzhledem ke vzrůstajícím požadavkům na přesnost vyhodnocování fair value v oblasti životního pojištění je v současné době potřebné nalézt vhodnou metodu, která umožňuje rozdělit smlouvy do shluků. Shluky definované pro tento účel nemají rozumnou interpretaci a i v jiných ohledech se liší od ?klasických? shluků, nicméně některé závěry zde publikované lze jistě zobecnit. V této práci jsou po teoretické stránce popsány metody k-průměrů a metoda SOM, založená na umělých neuronových sítích. V rámci diplomové práce byly navrženy vlastní modifikace těchto postupů. V další části jsou tyto metody kvantitativně zhodnoceny podle klasického hlediska shlukové analýzy a rovněž podle vhodnosti k modelování fair value. Bude ukázáno, že lze celkem úspěšně pomocí vlastních modifikací získat shluky, jejichž vnitroskupinová variabilita je menší, než je tomu u ostatních uvažovaných metod, a jejich fair value se neliší příliš od fair value původních smluv. Na přiloženém CD je uloženo několik zdrojových kódů v Matlabu/Scilabu, které byly vyvinuty speciálně pro účely této práce, a rovněž několik souborů s výstupy z těchto metod.
Clustering methods for large datasets
Vilikus, Ondřej ; Fialová, Hana (advisor) ; Húsek, Dušan (referee)
S rostoucím množstvím shromažďovaných a ukládaných dat vzniká potřeba shlukovacích metod, které by se dokázaly vypořádat i s rozsáhlými datovými soubory. Proto se objevuje množství nových algoritmů, vycházejících jak ze statistických přístupů, tak i z oblasti strojového učení. Cílem této diplomové práce je stručně představit dostupné metody shlukové analýzy a zhodnotit jejich silné a slabé stránky při analýze velkých souborů. Obsahem teoretické části je shrnutí základních pojmů a principů, které jsou všem metodám společné, a popisu nejznámějších metod shlukové analýzy. Ten obsahuje stručné vysvětlení, na jakém principu fungují a jaké výhody nebo případné nedostatky můžeme při jejich použití očekávat. Praktická část práce je věnována vlastnímu testování osmi metod dostupných v komerčním (SPSS, S-PLUS, STATISTICA) nebo akademickém (Weka) softwaru. Pro testování jsou použity umělé soubory se specifickými charakteristikami, které jsem vygeneroval pomocí vlastního algoritmu. Ten je rozšířením Neyman-Scottova procesu a kromě sférických shluků generuje i shluky nepravidelných tvarů. Výsledky potvrzují očekávání vycházející z teoretických předpokladů. Přinášejí však možnost kvantifikace vlivu charakteru dat na vhodnost jednotlivých metod.

National Repository of Grey Literature : 62 records found   beginprevious53 - 62  jump to record:
See also: similar author names
1 HUŠEK, David
3 Husek, Daniel
Interested in being notified about new results for this query?
Subscribe to the RSS feed.