Název:
Zjednodušení použitelnosti nástrojů pro správu kvality dat pro datové inženýry
Překlad názvu:
Streamlining Usability of Enterprise Data Quality Management Tools for Data Engineers
Autoři:
Tomis, Zdeněk ; Bulej, Lubomír (vedoucí práce) ; Škoda, Petr (oponent) Typ dokumentu: Bakalářské práce
Rok:
2024
Jazyk:
eng
Abstrakt: [eng][cze] In the realm of data quality management, integrating robust data quality rules into automated workflows and data pipelines is essential for maintaining data integrity. This thesis addresses the gap in programmatic accessibility of Ataccama ONE's data qual- ity tools, which primarily leverage the proprietary Ataccama Expression Language. By reimplementing this language in Python, the project enhances its usability for data en- gineers who seek to consume these tools programmatically. The focus is on enabling data engineers to execute Ataccama's rules directly within Python. The viability of this implementation is tested through performance comparisons with similar solutions.V oblasti data quality managementu je pro zachování integrity dat zásadní integrovat pravidla kvality dat do automatizovaných workflows a datových pipelines. Tato práce se zabývá mezerou v programové dostupnosti nástrojů pro kvalitu dat společnosti Ataccama ONE, které využívají především proprietární jazyk Ataccama Expression Language. Re- implementací tohoto jazyka v jazyce Python projekt zvyšuje jeho použitelnost pro datové inženýry, kteří potřebují tyto nástroje využít programmaticky v různým prostředích. Dů- raz je kladen na to, aby datoví inženýři mohli provádět a spravovat pravidla Ataccama přímo v jazyce Python s ohledem na jednoduchost užití a minimální nároky. Užitelnost této implementace je otestována prostřednictvím porovnání výkonu s podobnými řeše- ními.
Klíčová slova:
data quality management|data engineering|performance evaluation; data quality management|data engineering|performance evaluation