Original title:
Strojové učení v úloze predikce vlivu nukleotidového polymorfismu
Translated title:
Prediction of the Effect of Nucleotide Substitution Using Machine Learning
Authors:
Šalanda, Ondřej ; Martínek, Tomáš (referee) ; Bendl, Jaroslav (advisor) Document type: Master’s theses
Year:
2015
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce prezentuje nový přístup k~predikci efektu nukleotidového polymorfismu v~lidském genomu. Cílem je vytvoření nového klasifikátoru, který kombinuje výsledky již existujících softwarových nástrojů. Tohoto konsenzu nad dílčími výsledky je dosaženo experimentováním s~metodami strojového učení, přičemž výsledný model pak tvoří nejúspěšnější z~nich. Závěrečné komplexní srovnání výsledků metaklasifikátoru s dílčími nástroji ukazuje průměrné navýšení obsahu plochy pod ROC křivkou o 3,4 a eskalaci normované přesnosti až o 7\,\%. Vytvořený prediktor je zpřístupněn prostřednictvím webového rozhraní na adrese http://ll06.sci.muni.cz:6232/snpeffect/.
This thesis brings a new approach to the prediction of the effect of nucleotide polymorphism on human genome. The main goal is to create a new meta-classifier, which combines predictions of several already implemented software classifiers. The novelty of developed tool lies in using machine learning methods to find consensus over those tools, that would enhance accuracy and versatility of prediction. Final experiments show, that compared to the best integrated tool, the meta-classifier increases the area under ROC curve by 3,4 in average and normalized accuracy is improved by up to 7\,\%. The new classifying service is available at http://ll06.sci.muni.cz:6232/snpeffect/.
Keywords:
Deoxyribonucleic acid; ensemble learning; machine learning; mutation; polymorphism; prediction; protein; training dataset; Deoxyribonukleová kyselina; konsenzuální predikce; mutace; polymorfismus; predikce; protein; strojové učení; trénovací dataset
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/52242