Národní úložiště šedé literatury Nalezeno 30 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Linked Data Integration
Michelfeit, Jan ; Knap, Tomáš (vedoucí práce) ; Klímek, Jakub (oponent)
Linked Data je úspěšná forma publikování strukturovaných dat, která by mohla znamenat pro data to samé, co dokázal web pro dokumenty. Silná stránka Linked Data je jejich vhodnost pro integraci dat z více zdrojů. Integrace Linked Data otevírá dveře novým příležitostem, ale zároveň přináší nové výzvy. Je třeba vyvinout nové algoritmy a nástroje pokrývající všechny kroky datové integrace. Tato práce se zabývá tradičním postupem integrace dat a jeho aplikací na Linked Data, se zaměřením na řešení konfliktů, které se mohou objevit. Práce navrhuje nový algoritmus pro řešení konfliktů, který zároveň podporuje důvěru s pomocí informací o původu a analýzy kvality. Navržené algoritmy jsou implementované v rámci frameworku ODCleanStore pro integraci Linked Data.
Converting HTML product data to Linked Data
Kadleček, Rastislav ; Nečaský, Martin (vedoucí práce) ; Svoboda, Martin (oponent)
Pre priblíženie sa myšlienke Sémantického Webu je potrebný výskum v oblasti získavania sémantických informácií z dokumentov publikovaných na súčasnom Webe 2.0. Neustále narastajúci počet dát publikovaných vo forme relačných tabuliek viedol ku vzniku systému Odalic. Systém Odalic, založený na rozšírenej verzii Semantic Table Interpretation algoritmu TableMiner+ , poskytuje pohodlný spôsob sémantizácie tabuľkových dát za pomoci existujúcich znalostných databáz. Cieľom tejto práce je navrhnúť vylepšenú verziu algoritmu pre systém Odalic, ktorý by mu umožnil získať sémantické informácie z tabuliek reprezentujúcich dáta o produktoch z e-shopov napriek tomu, že takéto dáta majú v existujúcich znalostných databázach neveľké zastúpenie. To by malo byť dosiahnuté použitím metódy strojového učenia - klasifikácie. Táto diplomová práca sa skladá z týchto častí - získavanie a príprava dát o produktoch z e-shopov, porovnanie niekoľkých vybraných klasifikačných algoritmov, popis návrhu a implementácie vylepšeného algoritmu pre systém Odalic, popis integrácie tohto algoritmu do systému Odalic, vyhodnotenie prínosu tohto algoritmu pre systém Odalic za pomoci získaných produktových dát a sémantizácia získaných...
Implementace Business Intelligence v MVNO
Kamenchshikova, Alena ; Pour, Jan (vedoucí práce) ; Basl, Josef (oponent)
Cílem této diplomové práce je implementace Business Intelligence řešení pro virtuálního mobilního operátora Erbia Mobile, s.r.o. První část je rozdělena do popisu a analýzy konceptů a architektury spojené s nasazením Business Intelligence. Druhá část se zabývá technickými aspekty zavedení BI do společnosti. Řešení je sestaveno na základě požadavků, které byly zjištěné od managementu společnosti během několika pohovorů. Implementace se začíná analýzou datových zdrojů, kterými společnost disponuje a detailním popisem atributů podstatných pro telekomunikační oblast. Na základě požadavků a analýzy datových zdrojů se popisuje sestavená multidimenzionální analýza. Další část popisuje řešení jednotlivých komponentů (datový sklad, datovou pumpu a OLAP kostky), včetně použitých optimalizačních metod. Dané komponenty vyvíjené na platformě od Microsoft pomoci Integration, Analysis a Reporting Services. Finální reporty a vizualizace dashboardů jsou sestavené pomoci nástrojů MS Excel a Power BI.
Datová kvalita a její analýza v nebankovní společnosti poskytující půjčky
Vránek, Pavel ; Maryška, Miloš (vedoucí práce) ; Espinoza, Felix (oponent)
Bakalářská práce je zaměřena na komplexní zpracování tématu datová kvalita od teoretického popisu práce s daty v informačním systému, přes definici datové kvality, popis příčin vzniku nekvalitních dat a důsledků, které nekvalitní data přináší, až po analyzování datové kvality v nebankovní společnosti poskytující půjčky. Pro provedení analýzy datové kvality budou nejdříve vybrány vhodné dimenze datové kvality, ke kterým budou následně definovány metriky. Tyto metriky budou následně měřeny nad reálnými daty s využitím dotazovacího jazyka SQL a softwaru určeného pro analýzu datové kvality. Hlavním přínosem práce je komplexní zpracování problematiky datové kvality a ukázka reálného stavu datové kvality v nebankovní společnosti poskytující půjčky. Práce nabízí možnost rozšíření o návrh metodik a pravidel pro řízení datové kvality.
Linked Data Integration
Michelfeit, Jan ; Knap, Tomáš (vedoucí práce) ; Klímek, Jakub (oponent)
Linked Data je úspěšná forma publikování strukturovaných dat, která by mohla znamenat pro data to samé, co dokázal web pro dokumenty. Silná stránka Linked Data je jejich vhodnost pro integraci dat z více zdrojů. Integrace Linked Data otevírá dveře novým příležitostem, ale zároveň přináší nové výzvy. Je třeba vyvinout nové algoritmy a nástroje pokrývající všechny kroky datové integrace. Tato práce se zabývá tradičním postupem integrace dat a jeho aplikací na Linked Data, se zaměřením na řešení konfliktů, které se mohou objevit. Práce navrhuje nový algoritmus pro řešení konfliktů, který zároveň podporuje důvěru s pomocí informací o původu a analýzy kvality. Navržené algoritmy jsou implementované v rámci frameworku ODCleanStore pro integraci Linked Data.
Datová kvalita v prostředí databáze hospodářských informací
Cabalka, Martin ; Chlapek, Dušan (vedoucí práce) ; Kučera, Jan (oponent)
Diplomová práce se zabývá výběrem vhodných dimenzí datové kvality pro zvolenou databázi hospodářských informací, následným návrhem a implementací metrik pro jejich vyhodnocování. Cílem práce je definice pojmu datová kvalita v kontextu databáze hospodářských informací a možnosti jejího měření. Na základě dimenzí vhodných ke sledování je sestaven seznam metrik. Tyto metriky jsou následně implementovány v dotazovacím jazyce SQL, případně procedurální nástavbě Transact SQL. Metriky jsou rovněž otestovány nad reálnými daty a výsledky komentovány. Hlavní přínos této práce je komplexní zpracování tématu datové kvality od teoretického popisu jednotlivých činností, až po konkrétní implementace jednotlivých metrik. Zároveň práce nabízí několik teoretických i praktických směrů, kterými lze dané téma rozvíjet.
Varianty řízení datové kvality v rámci regulace Solvency II
Pastrňáková, Alena ; Bína, Vladislav (vedoucí práce) ; Přibil, Jiří (oponent)
Diplomová práce se zabývá datovou kvalitou v souvislosti se zákonnými požadavky regulace Solvency II, které musí pojišťovny splnit pro udržení licence. Cílem práce je posoudit příležitosti a dopady zavedení datové kvality pro Solvency II. Veškeré požadavky regulace pro datovou kvalitu jsou specifikovány a doplněny o možnosti jejich splnění. Dále jsou popsány související oblasti datové kvality. Na základě znalostí a získaných informací jsou v diplomové práci porovnány vzorové varianty manuálního, částečně automatizovaného a plně automatizovaného řešení s ohledem na finanční a časovou náročnost. Přínosem této práce je zhodnocení možných pozitivních i negativních dopadů implementace datové kvality pro Solvency II s přihlédnutím k možnosti rozšiřování v rámci celé společnosti. Obecné varianty řešení mohou být použity pro rozhodování o implementaci datové kvality ve většině společností i mimo pojišťovnictví.
Kvalita kmenových dat a datová synchronizace v segmentu FMCG
Tlučhoř, Tomáš ; Chlapek, Dušan (vedoucí práce) ; Kučera, Jan (oponent)
Diplomová práce se zabývá problematikou kvality kmenových dat u odběratelů a dodavatelů rychloobrátkového zboží. Cílem je zmapovat tok kmenových dat o produktech v dodavatelském řetězci odvětví FMCG a identifikovat slabá místa způsobující jejich nekvalitu. Důraz je kladen především na analýzu procesu zalistování nového zboží u obchodního řetězce. Jedním ze způsobů zvýšení efektivity procesu zalistování a zlepšení kvality kmenových dat je využití globální datové synchronizace. Dalším cílem práce je proto objasnit příčiny nízké míry využití globální datové synchronizace na českém trhu. Pozornost je rovněž věnována návrhům na opatření vedoucích ke zvýšení kvality kmenových dat v odvětví FMCG a rozvoji globální datové synchronizace v ČR. Diplomová práce je rozdělena na část teoretickou a praktickou. Teoretická část se zabývá vymezením pojmů, fungováním dodavatelského řetězce a komunikací jeho jednotlivých článků, teorií datové kvality a přístupy k jejímu řízení. V praktické části jsou řešeny cíle práce, kterých je dosaženo na základě výsledků dvoufázového průzkumu mezi dodavateli a odběrateli rychloobrátkového zboží na českém trhu. Přínosem je obohacení odborné literatury, která se problematikou kvality kmenových dat v segmentu FMCG a globální datové synchronizace příliš nezabývá. Pro dodavatele a odběratele rychloobrátkového zboží mohou výsledky práce představovat impuls pro snahu o zlepšení kvality vlastních kmenových dat. Představeny jsou i způsoby, kterými lze tohoto zlepšení dosáhnout. V organizaci GS1 Czech Republic, jež téma diplomové práce zadala, lze výsledky použít jako podklad pro rozhodování o dalším vývoji v oblasti globální datové synchronizace.
Úloha profilace v řízení datové kvality
Fišer, David ; Pejčoch, David (vedoucí práce) ; Kyjonka, Vladimír (oponent)
Cílem diplomové práce je zjistit úlohu datové profilace v řízení datové kvality a zanalyzovat stav současných SW nástrojů v oblasti datové profilace. Úloha datové profilace byla určena na základě analýzy obecných metodik přístupu k řízení datové kvality. Pro analýzu data profilačních nástrojů byla sestavena speciální metodika. Tato metodika se zaměřuje na tři základní aspekty, jimiž jsou technické předpoklady, uživatelská přívětivost a funkčnost. Na základě této metodiky bylo vybráno nejvhodnější dostupné SW řešení pro datovou profilaci a zároveň byly analyzovány obecné nedostatky testovaných SW nástrojů.
Benchmark nástrojů pro řízení datové kvality
Černý, Jan ; Pejčoch, David (vedoucí práce) ; Máša, Petr (oponent)
Společnosti po celém světě stále více a více promrhávají své rozpočty v důsledku nekvalitních dat. Logicky, se zvyšujících se množstvím zpracovávaných informací roste i množství chyb v nich. Tato práce vysvětluje co je datová kvalita, příčiny vzniku chyb v datech, jejich důsledky i to jakým způsobem lze datovou kvalitu měřit. A pokud něco lze měřit, lze to i zlepšit. K tomu slouží nástroje pro řízení datové kvality. Trh s nástroji pro řízení datové kvality nabízí jak komerční, tak open-source řešení. Porovnáním nástroje DataCleaner (open-source) a DataFlux (komerční) na modelovém příkladu dle definovaných kritérií bylo v této práci dokázáno, že nástroje si mohou být rovné v oblasti profilace dat, obohacování a monitorování. Standardizaci a validaci zvládá lépe DataFlux. Deduplikace v DataCleaneru chybí, přestože byla výrobcem uváděna. Jednou z velkých překážek bránících firmám nákupu nástroje pro řízení datové kvality může být právě jeho vysoká cena. V tuto chvíli je již možné považovat DataCleaner za plnohodnotné levné řešení v oblasti profilace dat. Za podmínky, že společnost Human Inference doplní do DataCleaneru i deduplikaci dat, bude ho možné považovat za konkurenci v oblasti celého procesu řízení dat.

Národní úložiště šedé literatury : Nalezeno 30 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.