Original title:
Paralelní zpracování velkých objemů astronomických dat
Translated title:
Parallel Processing of Huge Astronomical Data
Authors:
Haas, František ; Zavoral, Filip (advisor) ; Kruliš, Martin (referee) Document type: Master’s theses
Year:
2016
Language:
eng Abstract:
[eng][cze] This master thesis focuses on the Random Forests algorithm analysis and implementation. The Random Forests is a machine learning algorithm targeting data classification. The goal of the thesis is an implementation of the Random Forests algorithm using techniques and technologies of parallel programming for CPU and GPGPU and also a reference serial implementation for CPU. A comparison and evaluation of functional and performance attributes of these implementations will be performed. For the comparison of these implementations various data sets will be used but an emphasis will be given to real world data obtained from astronomical observations of stellar spectra. Usefulness of these implementations for stellar spectra classification from the functional and performance view will be performed. Powered by TCPDF (www.tcpdf.org)Diplomová práce se zabývá analýzou a implementací algoritmu náhodných lesů. Náhodné lesy jsou algoritmem strojového učení pro klasifikaci dat. Cílem práce je implementace náhodných lesů pomocí technologií paralelního programování pro CPU a GPGU a referenční sériové implementace pro CPU. Dále pak porovnání a vyhodnocení výkonnosti a přesnosti těchto implementací na různých hardwarových platformách. Pro porovnání implementací budou použity různé datové soubory, důraz bude kladen na reálná astronomická data získaná z pozorování stelárních spekter. Bude posouzena vhodnost užití algoritmů náhodných lesů pro klasifikaci stelárních spekter jak z funkčního tak výkonnostního hlediska. Powered by TCPDF (www.tcpdf.org)
Keywords:
data mining; machine learning; parallel programming; random forests; dolování z dat; náhodné lesy; paralelní programování; strojové učení
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/83094