Original title:
Sociální sítě a dobývání znalostí
Translated title:
Social networks and data mining
Authors:
Zvirinský, Peter ; Mrázová, Iveta (advisor) ; Neruda, Roman (referee) Document type: Master’s theses
Year:
2014
Language:
eng Abstract:
[eng][cze] Recent data mining methods represent modern approaches capable of analyzing large amounts of data and extracting meaningful and potentially useful information from it. In this work, we discuss all the essential steps of the data mining process - including data preparation, storage, cleaning, data analysis as well as visualization of the obtained results. In particular, this work is focused on the data available publicly from the Insolvency Register of the Czech Republic, that comprises all insolvency proceedings commenced after 1. January 2008 in the Czech Republic. With regard to the considered type of data, several data mining methods have been discussed, implemented, tested and evaluated. Among others, the studied techniques include Market Basket Analysis, Bayesian networks and social network analysis. The obtained results reveal several social patterns common in the current Czech society.Aktuální techniky z oblasti dobývání znalostí představují moderní přístup vhodný pro analýzu velkého množství dat i extrakci potenciálně užitečných informací z těchto dat. Práce je věnována detailnímu studiu jednotlivých kroků procesu dobývání znalostí, včetně přípravy dat, jejich ukládání, čištění, analýzy i vizualizace získaných výsledků. Velký důraz je v práci kladen na efektivní analýzu dat veřejně dostupných z Insolvenčního rejstříku České republiky, který obsahuje údaje o insolvenčních řízeních zahájených v České republice po 1. lednu 2008. S ohledem na specifika uvažovaného typu dat se zaměříme zejména na popis, implementaci, testování a vyhodnocení vybraných metod dobývání znalostí. Mezi jinými budou studované techniky zahrnovat i analýzu nákupního košíku, Bayesovské sítě a metody pro analýzu sociálních sítí. Výsledky provedených analýz dokumentují některé ze sociálních vztahů patrných ve struktuře současné české společnosti.
Keywords:
classification; data mining; data pre-processing; knowledge extraction; social networks; dobývání znalostí; extrakce znalostí; klasifikace; předzpracování dat; sociální sítě
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/65996