Název:
Paralelní zpracování velkých objemů astronomických dat
Překlad názvu:
Parallel Processing of Huge Astronomical Data
Autoři:
Haas, František ; Zavoral, Filip (vedoucí práce) ; Kruliš, Martin (oponent) Typ dokumentu: Diplomové práce
Rok:
2016
Jazyk:
eng
Abstrakt: [eng][cze] This master thesis focuses on the Random Forests algorithm analysis and implementation. The Random Forests is a machine learning algorithm targeting data classification. The goal of the thesis is an implementation of the Random Forests algorithm using techniques and technologies of parallel programming for CPU and GPGPU and also a reference serial implementation for CPU. A comparison and evaluation of functional and performance attributes of these implementations will be performed. For the comparison of these implementations various data sets will be used but an emphasis will be given to real world data obtained from astronomical observations of stellar spectra. Usefulness of these implementations for stellar spectra classification from the functional and performance view will be performed. Powered by TCPDF (www.tcpdf.org)Diplomová práce se zabývá analýzou a implementací algoritmu náhodných lesů. Náhodné lesy jsou algoritmem strojového učení pro klasifikaci dat. Cílem práce je implementace náhodných lesů pomocí technologií paralelního programování pro CPU a GPGU a referenční sériové implementace pro CPU. Dále pak porovnání a vyhodnocení výkonnosti a přesnosti těchto implementací na různých hardwarových platformách. Pro porovnání implementací budou použity různé datové soubory, důraz bude kladen na reálná astronomická data získaná z pozorování stelárních spekter. Bude posouzena vhodnost užití algoritmů náhodných lesů pro klasifikaci stelárních spekter jak z funkčního tak výkonnostního hlediska. Powered by TCPDF (www.tcpdf.org)
Klíčová slova:
dolování z dat; náhodné lesy; paralelní programování; strojové učení; data mining; machine learning; parallel programming; random forests