Název:
Datová kvalita v prostředí otevřených a propojitelných dat
Překlad názvu:
Data quality on the context of open and linked data
Autoři:
Tomčová, Lucie ; Chlapek, Dušan (vedoucí práce) ; Kučera, Jan (oponent) Typ dokumentu: Diplomové práce
Rok:
2014
Jazyk:
cze
Nakladatel: Vysoká škola ekonomická v Praze
Abstrakt: [cze][eng] Diplomová práce se zabývá datovou kvalitou v prostředí otevřených a propojitelných dat. Mezi cíle patří vymezení specifik datové kvality v tomto prostředí. Na specifika je nahlíženo zejména z pohledu dimenzí datové kvality (tj. vlastností dat, které v rámci datové kvality sledujeme) a možností jejich měření. Dále práce definuje vliv, který má na datovou kvalitu převod dat do propojitelné podoby, a to s přihlédnutím k možným rizikům a přínosům, které dále datovou kvalitu mohou ovlivňovat. Na základě stanovených dimenzí datové kvality, které jsou shledány jako relevantní pro prostředí otevřených a propojitelných dat, je sestaven seznam metrik, jež jsou verifikovány na reálných datech (otevřená propojitelná data publikována orgánem státní správy). Práce ukazuje na potřebu posouzení a řízení datové kvality s přihlédnutím k rozdílům, které se váží k tomuto specifickému prostředí. Zároveň práce nabízí možnosti dalšího zkoumání této problematiky a prezentuje navazující směry, kterými je možné ubírat se při teoretickém i praktickém rozvíjení tématu.The master thesis deals with data quality in the context of open and linked data. One of the goals is to define specifics of data quality in this context. The specifics are perceived mainly with orientation to data quality dimensions (i. e. data characteristics which we study in data quality) and possibilities of their measurement. The thesis also defines the effect on data quality that is connected with data transformation to linked data; the effect if defined with consideration to possible risks and benefits that can influence data quality. The list of metrics verified on real data (open linked data published by government institution) is composed for the data quality dimensions that are considered to be relevant in context of open and linked data. The thesis points to the need of recognition of differences that are specific in this context when assessing and managing data quality. At the same time, it offers possibilities for further study of this question and it presents subsequent directions for both theoretical and practical evolution of the topic.
Klíčová slova:
datová kvalita; dimenze kvality dat; LOD; metriky kvality dat; OD; otevřená data; propojitelná data; data quality; data quality dimensions; data quality metrics; linked data; LOD; OD; open data
Instituce: Vysoká škola ekonomická v Praze
(web)
Informace o dostupnosti dokumentu:
Dostupné v digitálním repozitáři VŠE. Původní záznam: http://www.vse.cz/vskp/eid/44127