Název:
Sociální sítě a dobývání znalostí
Překlad názvu:
Social networks and data mining
Autoři:
Zvirinský, Peter ; Mrázová, Iveta (vedoucí práce) ; Neruda, Roman (oponent) Typ dokumentu: Diplomové práce
Rok:
2014
Jazyk:
eng
Abstrakt: [eng][cze] Recent data mining methods represent modern approaches capable of analyzing large amounts of data and extracting meaningful and potentially useful information from it. In this work, we discuss all the essential steps of the data mining process - including data preparation, storage, cleaning, data analysis as well as visualization of the obtained results. In particular, this work is focused on the data available publicly from the Insolvency Register of the Czech Republic, that comprises all insolvency proceedings commenced after 1. January 2008 in the Czech Republic. With regard to the considered type of data, several data mining methods have been discussed, implemented, tested and evaluated. Among others, the studied techniques include Market Basket Analysis, Bayesian networks and social network analysis. The obtained results reveal several social patterns common in the current Czech society.Aktuální techniky z oblasti dobývání znalostí představují moderní přístup vhodný pro analýzu velkého množství dat i extrakci potenciálně užitečných informací z těchto dat. Práce je věnována detailnímu studiu jednotlivých kroků procesu dobývání znalostí, včetně přípravy dat, jejich ukládání, čištění, analýzy i vizualizace získaných výsledků. Velký důraz je v práci kladen na efektivní analýzu dat veřejně dostupných z Insolvenčního rejstříku České republiky, který obsahuje údaje o insolvenčních řízeních zahájených v České republice po 1. lednu 2008. S ohledem na specifika uvažovaného typu dat se zaměříme zejména na popis, implementaci, testování a vyhodnocení vybraných metod dobývání znalostí. Mezi jinými budou studované techniky zahrnovat i analýzu nákupního košíku, Bayesovské sítě a metody pro analýzu sociálních sítí. Výsledky provedených analýz dokumentují některé ze sociálních vztahů patrných ve struktuře současné české společnosti.
Klíčová slova:
dobývání znalostí; extrakce znalostí; klasifikace; předzpracování dat; sociální sítě; classification; data mining; data pre-processing; knowledge extraction; social networks