Název:
Efektivní paralelní zpracování dat na moderním hardware
Překlad názvu:
Towards Efficient Parallel Data Processing on Modern Hardware
Autoři:
Falt, Zbyněk ; Yaghob, Jakub (vedoucí práce) ; Smrž, Pavel (oponent) ; Benkner, Siegfried (oponent) Typ dokumentu: Disertační práce
Rok:
2014
Jazyk:
eng
Abstrakt: [eng][cze] Parallel data processing is a very hot topic in current research, since the amount of data and the complexity of the operations performed on them has been increasing significantly in the past few years. In this thesis, we focus on a specific domain of this research -- the design and implementation of parallel algorithms used mainly in database systems. First, we introduce important enhancements in the Bobox system, which is a framework for the development of parallel data processing applications. Then, we introduce a new domain specific language called Bobolang which makes the implementation of those applications easier. Next, we propose parallel and scalable algorithms used in the domain of databases, namely sort and merge join, and introduce their efficient implementation using the combination of Bobox and Bobolang. Finally, we introduce parallel runtime for SPARQL engine as an example of a parallel data processing application which demonstrates the main contributions of this thesis in complex and real-life situations. Powered by TCPDF (www.tcpdf.org)Paralelní zpracování dat je velmi aktuální téma současného výzkumu, neboť množství dat a složitost operací nad nimi v poslední době výrazně vzrůstá. V~této práci se zaměřujeme na specifickou oblast toho výzkumu - na návrh a implementaci paralelních algoritmů používaných v databázových systémech. Nejdříve popíšeme důležitá vylepšení systému Bobox, který je určen pro vývoj aplikací pro zpracování dat v paralelním prostředí. Následně uvedeme nový doménově specifický jazyk Bobolang, jehož úkolem je usnadnit vývoj těchto aplikací. Dále využijeme kombinaci systému Bobox a jazyka Bobolang při návrhu paralelních algoritmů, zejména třídění a algoritmu merge join. Na závěr představíme implementaci paralelního běhového prostředí pro vyhodnocování dotazů v jazyce SPARQL, které prezentuje výsledky této práce v komplexní a reálné aplikaci. Powered by TCPDF (www.tcpdf.org)
Klíčová slova:
Bobolang; Bobox; paralelní algoritmy; SPARQL; Bobolang; Bobox; parallel algorithms; SPARQL