Název:
Spojování dat
Překlad názvu:
Data fusion
Autoři:
Janíková, Veronika ; Hovorka, Tomáš (vedoucí práce) ; Anděl, Jiří (oponent) Typ dokumentu: Bakalářské práce
Rok:
2014
Jazyk:
cze
Abstrakt: [cze][eng] Práce se zabývá spojováním databází, jakožto jednou z možností řešící velmi častý problém dostupnosti dat v praxi. Úvodem je zmíněno praktické využití fúze dat, zejména v oblasti marketingu, a základní algoritmy a problémy spojování dat. Hlavní část práce se pak zabývá takzvanou " statistickou fúzí bez omezení". Nej- prve je podrobně teoreticky popsána jedna z možností průběhu tohoto typu fúze, přičemž dochází k větvení na čtyři různé typy. Následně je za pomoci statis- tických ukazatelů navržena metoda teoretického vyhodnocení úspěšnosti obecné fúze. V praktické části práce je pomocí statistického programu R naprogramován průběh všech čtyř typů statistické fúze bez omezení i jejich následné vyhodno- cení. Fúze je poté aplikována na námi vygenerovanou databázi a dále na skutečná data sesbíraná v praxi, která nám byla poskytnuta společností Median. V poslední části práce jsou pak interpretovány, vyhodnocovány a diskutovány výsledky fúzí na těchto dvou konkrétních databázích.This bachelor's thesis deals with a data fusion, which is a one of the possible solutions to the common problem of data availability in praxis. In the first part, practical use of data fusion, especially in marketing, fundamental algorithms and data fusion problems are discussed. The main part of this thesis deals with the so-called "unconstrained statistical fusion". Firstly, one of the possible processes of this type of fusion is described theoretically in detail. This process involves branching into four different types of data fusion. Next, a method of theoretical evaluating the quality of the general fusion model is designed using statistical indicators. The practical part of the thesis contents processes of four types of unconstrained statistical fusion and their evaluation which both are programmed in statistical program R. Furthermore, the fusion is applied to our artificially generated database and also to a real data collected in praxis by Czech public opinion research company Median. In the very last part of the thesis, the results of fusions applied to these two databases are interpreted, evaluated and discussed.
Klíčová slova:
modelování dat; Spojování a integrace dat; Data fusion; data integration; data modelling