Original title:
Datová kvalita, integrita a konsolidace dat v BI
Translated title:
Data Quality, Data intagrity and Data Consolidation in BI
Authors:
Smolík, Ondřej ; Pour, Jan (advisor) ; Zajíc, Ján (referee) Document type: Master’s theses
Year:
2008
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Tato práce se zabývá datovou kvalitou v systémech business inteligence. Jsou zde ukázány základní zásady, které je vhodné využívat při tvorbě datové skladu, tak aby byla dosažena co nejvyšší datová kvalita. Dále jsou zde ukázány některé metody čištění dat, jako detekce odchylek, name-address cleansing apod. Práce se zabývá nejen kvalitou dat přímo v datovém skladě, ale i daty, které do něj teprve budou vstupovat. Druhá část práce pak ukazuje metody čištění dat na konkrétním příkladu datového skladu. Ukazujeme v ní, jaké metody jsou použity a jaké další by se zde daly použít. Dále jsou zde uvedena některá doporučení, která vyplývají ze studia literatury a doporučení týkající se získávaní externích dat od obchodních partnerů.This thesis fights with the data quality in business intelligence. We present basic principles for building data warehouse to achieve the highest data quality. We also present some data clearing methods as deviation detection or name-address clearing. This work also deals with origin of erroneous data and prevention of their generation. In second part of this thesis we show presented methods and principles on real example of data warehouse and we suggest how to get sales data from our business partners or customers.
Keywords:
Business Intelligence; Data Cleansing; Data Quality; Data warehouse; Business Intelligence; datová kvalita; datový sklad; čištění dat
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/16373