Original title:
Efektivní paralelní zpracování dat na moderním hardware
Translated title:
Towards Efficient Parallel Data Processing on Modern Hardware
Authors:
Falt, Zbyněk ; Yaghob, Jakub (advisor) ; Smrž, Pavel (referee) ; Benkner, Siegfried (referee) Document type: Doctoral theses
Year:
2014
Language:
eng Abstract:
[eng][cze] Parallel data processing is a very hot topic in current research, since the amount of data and the complexity of the operations performed on them has been increasing significantly in the past few years. In this thesis, we focus on a specific domain of this research -- the design and implementation of parallel algorithms used mainly in database systems. First, we introduce important enhancements in the Bobox system, which is a framework for the development of parallel data processing applications. Then, we introduce a new domain specific language called Bobolang which makes the implementation of those applications easier. Next, we propose parallel and scalable algorithms used in the domain of databases, namely sort and merge join, and introduce their efficient implementation using the combination of Bobox and Bobolang. Finally, we introduce parallel runtime for SPARQL engine as an example of a parallel data processing application which demonstrates the main contributions of this thesis in complex and real-life situations. Powered by TCPDF (www.tcpdf.org)Paralelní zpracování dat je velmi aktuální téma současného výzkumu, neboť množství dat a složitost operací nad nimi v poslední době výrazně vzrůstá. V~této práci se zaměřujeme na specifickou oblast toho výzkumu - na návrh a implementaci paralelních algoritmů používaných v databázových systémech. Nejdříve popíšeme důležitá vylepšení systému Bobox, který je určen pro vývoj aplikací pro zpracování dat v paralelním prostředí. Následně uvedeme nový doménově specifický jazyk Bobolang, jehož úkolem je usnadnit vývoj těchto aplikací. Dále využijeme kombinaci systému Bobox a jazyka Bobolang při návrhu paralelních algoritmů, zejména třídění a algoritmu merge join. Na závěr představíme implementaci paralelního běhového prostředí pro vyhodnocování dotazů v jazyce SPARQL, které prezentuje výsledky této práce v komplexní a reálné aplikaci. Powered by TCPDF (www.tcpdf.org)
Keywords:
Bobolang; Bobox; parallel algorithms; SPARQL; Bobolang; Bobox; paralelní algoritmy; SPARQL
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/63382