Original title:
Reakce na výjimky a alerty v ETL
Translated title:
Reaction to errors and alerts in ETL
Authors:
Klimt, Roman ; Pour, Jan (advisor) ; Zajíc, Ján (referee) Document type: Bachelor's theses
Year:
2008
Language:
cze Publisher:
Vysoká škola ekonomická v Praze Abstract:
[cze][eng] Tato práce se věnuje informačním systémům nazývaným Business Intelligence (BI). Konkrétně se zaměřím hlavně na část získávání dat z primárních systémů neboli etapu nazývanou jako extract, transform, load (ETL). ETL je jedna z klíčových fází BI řešení, jedná se o výchozí část, při které se načítají data z primárních systémů podniku. Na tom, v jakém stavu budou data přenesená do datového skladu, závisí veškeré prováděné analýzy a vytvářené reporty. Cílem této práce je navrhnout řešení pro již provozované projekty, které postrádají automatizovaný mechanismus informování uživatelů o chybných datech. V případě, že data z primárních systémů jsou v takovém stavu, že se k nim procesu ETL nepodaří přiřadit příslušné klíče, tak se tato data ukládají do speciálních tabulek a nezahrnují se do analýz. Jedná se o velmi závažný problém, jelikož analýzy a reporty, které systém vytváří, mohou být značně zkresleny. Tato data většinou nelze opravit nijak jinak, než opravou v primárních systémech. Aby se data mohla opravit, musí správci primárních systémů o těchto datech vědět. Právě pro informování správců systémů se pokusím navrhnout automatizovaný systém informování pomocí rozesílaných e-mailů s informacemi o špatných datech.This work deals with information systems called Business Intelligence (BI). Especially, it focuses on one part, whose task is to extract data from primary information systems. This stage is known as extract, transform, load (ETL). ETL is one of the most important stage in BI solutions because the quality of data depends on this stage. These data are used for all analyses and created reports. The goal of this work is to suggest solution for active projects, which are short of automated controlling mechanism. This mechanism should inform users of BI solutions about errors in data. If data from primary systems are in such bad state that ETL process is not able to match primary keys to them, the data are stored in special tables and are not used for future analyses. This is a very serious problem because analyses and reports based on the data may be misrepresentative. This problem must be solved by repairing the data in primary information systems. The administrator of primary information system has to know about the incorrect so that the data could be repaired. Therefore, an automated e-mailing system has been designed to inform about the incorrect data.
Keywords:
Business Intelligence; data; data warehouse; database; EAI; ETL; Integration services; SQL Server; SSIS; Business Intelligence; data; databáze; datový sklad; EAI; ETL; Integration Services; SQL Server; SSIS
Institution: University of Economics, Prague
(web)
Document availability information: Available in the digital repository of the University of Economics, Prague. Original record: http://www.vse.cz/vskp/eid/14700