Original title:
Optimalizace platformy pro distribuované výpočty Hadoop
Translated title:
Optimization of the Hadoop Platform for Distributed Computation
Authors:
Čecho, Jaroslav ; Smrčka, Aleš (referee) ; Letko, Zdeněk (advisor) Document type: Master’s theses
Year:
2012
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato diplomová práce se zabývá možnostmi optimalizace frameworku Hadoop za pomocí platformy CUDA. Apache Hadoop je frameworku umožnující analýzu obrovských objemů dat. Obsahuje distribuovaný souborový systém a implementaci programovacího paradigmatu mapreduce s jehož pomocí se poté píší uživatelské aplikace. Platforma CUDA firmy NVIDIA umožnuje využít výkon grafické karty počítače i k jiným účelům než je generování grafického výstupu na zobrazovací zařízení počítače. Má prace obsahuje seznam a experimentální implementaci výpočtů frameworku Hadoop vhodných k přesunu z hlavního procesoru počítače na grafickou kartu za účelem dosáhutí časové optimalizace běžících mapreduce aplikací.
This thesis is focusing on possibilities of improving the Apache Hadoop framework by outsourcing some computation to a graphic card using the NVIDIA CUDA technology. The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using a simple programming model called mapreduce. NVIDIA CUDA is a platform which allows one to use a graphic card for a general computation. This thesis contains description and experimental implementations of suitable computation inside te Hadoop framework that can benefit from being executed on a graphic card.
Keywords:
CUDA; Hadoop; mapreduce; optimalization; CUDA; Hadoop; mapreduce; optimalizace
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53607