| |
| |
|
Škálovatelné předzpracování dat prostřednictvím nástroje Hadoop
Marinič, Michal ; Šmirg, Ondřej (oponent) ; Burget, Radim (vedoucí práce)
Tato práce se zabývá škálovatelným předzpracováním dat prostřednictvím nástroje Hadoop, který slouží pro paralelní zpracování velkého objemu dat. V první teoretické části se práce zaměřuje na vysvětlení fungování struktury základních funkčních prvků distribuovaného souborového systému HDFS a metody MapReduce pro paralelní zpracování. Praktická část práce popisuje realizaci Hadoop clusteru v pseudo-režimu pro jednoduché ladění aplikací a také realizaci v plně distribuovaném režimu pro simulaci nasazení v reálné praxi.
|
|
Aplikace pro řízení paralelního zpracování dat
Grepl, Filip ; Smrž, Pavel (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato práce se zabývá návrhem a realizací systému pro paralelní spouštění úloh ve Výzkumné skupině znalostních technologií. Cílem je vytvořit webovou aplikaci, která umožní řídit jejich zpracování a monitorovat běhy těchto úloh včetně využití systémových prostředků. V práci je nejprve analyzován současný způsob paralelního zpracování dat a nedostatky tohoto řešení. Poté jsou v práci popsány existující nástroje včetně problémů, které jejich testovací nasazení odhalilo. Na základě těchto poznatků jsou definovány požadavky na novou aplikaci a vytvořen návrh celého systému. Následně jsou popsány vybrané části implementace a způsob testování celého systému, které zahrnuje i porovnání efektivity s původním systémem.
|
|
Aplikace pro řízení paralelního zpracování dat
Grepl, Filip ; Smrž, Pavel (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Tato práce se zabývá návrhem a realizací systému pro paralelní spouštění úloh ve Výzkumné skupině znalostních technologií. Cílem je vytvořit webovou aplikaci, která umožní řídit jejich zpracování a monitorovat běhy těchto úloh včetně využití systémových prostředků. V práci je nejprve analyzován současný způsob paralelního zpracování dat a nedostatky tohoto řešení. Poté jsou v práci popsány existující nástroje včetně problémů, které jejich testovací nasazení odhalilo. Na základě těchto poznatků jsou definovány požadavky na novou aplikaci a vytvořen návrh celého systému. Následně jsou popsány vybrané části implementace a způsob testování celého systému, které zahrnuje i porovnání efektivity s původním systémem.
|
|
Vyhodnocování relačních dotazů v proudově orientovaném prostředí
Kikta, Marcel ; Bednárek, David (vedoucí práce) ; Černý, Tomáš (oponent)
Tato práce se zabývá návrhem a implementací překladače pro optimalizaci a transformaci dotazů relačních databází. Práce nejprve rozebere teorii překladačů databazových dotazů. Dále představujeme algoritmy a datové struktury použité při implementaci nástroje pro překlad dotazů. V závěrečné části práce diskutujeme důležité implementační detaily tohoto nástroje. Specifikujeme podmnožinu relační algebry, kterou použijeme jako vstup pro nástroj. Vstupem je dotaz napsaný v XML souboru ve formě relační algebry. Překladač dotaz optimalizuje a transformuje do fyzického plánu, který je vykonán pomocí paralelního prostředí Bobox. Výstupem překladače jsou fyzické plány v jazyce Bobolang, které následně slouží jako vstup pro Bobox. Powered by TCPDF (www.tcpdf.org)
|
| |
|
Škálovatelné předzpracování dat prostřednictvím nástroje Hadoop
Marinič, Michal ; Šmirg, Ondřej (oponent) ; Burget, Radim (vedoucí práce)
Tato práce se zabývá škálovatelným předzpracováním dat prostřednictvím nástroje Hadoop, který slouží pro paralelní zpracování velkého objemu dat. V první teoretické části se práce zaměřuje na vysvětlení fungování struktury základních funkčních prvků distribuovaného souborového systému HDFS a metody MapReduce pro paralelní zpracování. Praktická část práce popisuje realizaci Hadoop clusteru v pseudo-režimu pro jednoduché ladění aplikací a také realizaci v plně distribuovaném režimu pro simulaci nasazení v reálné praxi.
|
| |