Original title:
Evoluční strategie v úloze predikce vlivu aminokyselinových mutací na stabilitu proteinů
Translated title:
Prediction of Protein Stability upon Amino Acid Mutations Using Evolution Strategy
Authors:
Kadlec, Miroslav ; Burgetová, Ivana (referee) ; Bendl, Jaroslav (advisor) Document type: Master’s theses
Year:
2015
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá predikcí vlivu aminokyselinových mutací na stabilitu proteinu. Cílem je vytvořit konsenzuální prediktor využívající výstupy vybraných existujících nástrojů za účelem zvýšení úspěšnosti predikce. Optimální konsenzus mezi těmito nástroji byl hledán s pomocí evolučních strategií (ES) ve třech variantách: evoluční strategie s pravidlem 1/5, varianta s autoevolucí typu 2 a metoda CMA-ES. Kvalita nalezených řešení byla následně testována na nezávislé datové sadě. Výsledky všech tří variant dosahovaly podobných přesností predikce, jako nejlepší byl vyhodnocen vektor vah nalezený ES s autoevolucí typu 2. Oproti samostatným prediktorům vykazovala konsenzuální metoda na trénovacích datech zlepšení Pearsonova korelačního koeficientu o 0,057. Na testovací sadě byl její přínos nižší (zlepšení o 0,040). Poměrně malý přínos k přesnosti predikcí na trénovací i testovací datové sadě byl způsoben tím, že pro některé záznamy se nepodařilo získat výsledky všech dílčích nástrojů. V případě vypuštění těchto záznamů přinesla konsenzuální metoda zlepšení Pearsonova korelačního koeficientu o 0,118.
This thesis is focused on predicting the impact of amino acid substitution on protein stability. The main goal is to create a consensual predictor that uses the outputs of chosen existing tools in order to improve accuracy of prediction. The optimal consensus of theese tools was designed using evolution strategies in three variants: 1/5 success rule, self-adaptation variant and the CMA-ES method. Then, the quality of calculated weight vectors was tested on the independent dataset. Although the highest prediction performance was attained by self-adaptation method, the differences between all three variants were not significant. Compared to the individual tools, the predictions provided by consensual methods were generally more accurate - the self-adaptation variant imporved the Pearson's corelation coeficient of the predictions by 0,057 on the training dataset. On the testing dataset, the improvement of designed method was smaller (0,040). Relatively low improvement of prediction performance (both on the training and the testing dataset) were caused by the fact, that for some records of testing dataset, some individual tools vere not able to provide their results. When omitting these records, consensual method improved the Pearson's corelations coeficient by 0,118.
Keywords:
Amino acid mutations; amino acid substitutions; evolution strategy; protein predictions.; protein stability; Aminokyselinové mutace; aminokyselinové substituce; evoluční strategie; proteinové predikce.; stabilita proteinu
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/52250