Název:
Strojové učení v úloze predikce vlivu nukleotidového polymorfismu
Překlad názvu:
Prediction of the Effect of Nucleotide Substitution Using Machine Learning
Autoři:
Šalanda, Ondřej ; Martínek, Tomáš (oponent) ; Bendl, Jaroslav (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2015
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce prezentuje nový přístup k~predikci efektu nukleotidového polymorfismu v~lidském genomu. Cílem je vytvoření nového klasifikátoru, který kombinuje výsledky již existujících softwarových nástrojů. Tohoto konsenzu nad dílčími výsledky je dosaženo experimentováním s~metodami strojového učení, přičemž výsledný model pak tvoří nejúspěšnější z~nich. Závěrečné komplexní srovnání výsledků metaklasifikátoru s dílčími nástroji ukazuje průměrné navýšení obsahu plochy pod ROC křivkou o 3,4 a eskalaci normované přesnosti až o 7\,\%. Vytvořený prediktor je zpřístupněn prostřednictvím webového rozhraní na adrese http://ll06.sci.muni.cz:6232/snpeffect/.
This thesis brings a new approach to the prediction of the effect of nucleotide polymorphism on human genome. The main goal is to create a new meta-classifier, which combines predictions of several already implemented software classifiers. The novelty of developed tool lies in using machine learning methods to find consensus over those tools, that would enhance accuracy and versatility of prediction. Final experiments show, that compared to the best integrated tool, the meta-classifier increases the area under ROC curve by 3,4 in average and normalized accuracy is improved by up to 7\,\%. The new classifying service is available at http://ll06.sci.muni.cz:6232/snpeffect/.
Klíčová slova:
Deoxyribonukleová kyselina; konsenzuální predikce; mutace; polymorfismus; predikce; protein; strojové učení; trénovací dataset; Deoxyribonucleic acid; ensemble learning; machine learning; mutation; polymorphism; prediction; protein; training dataset
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/52242