Original title:
Multi-agentní systém pro predikci vlivu mutací na stabilitu proteinů
Translated title:
Multi-Agent System for the Prediction of the Effect of Mutations on Protein Stability
Authors:
Doseděl, Ondřej ; Martínek, Tomáš (referee) ; Musil, Miloš (advisor) Document type: Master’s theses
Year:
2022
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Proteiny jsou základním stavebním blokem všech žijících organismů, kde jsou zodpovědné za mnoho důležitých procesů. Jsou složeny z řetězců aminokyselin. Tyto řetězce mohou být jakkoliv změněné. Tomuto procesu se říká mutace a může být samovolná nebo indukovaná v laboratoři. Cílem této práce bylo vytvoření nových modelů pro určení stability proteinů. Skládá se ze dvou modelů. První model je multi-agentní systém pro klasifikaci stability proteinů. Nejlepší multi-agentní systém získal přesnost 0.7 a 0.41 MCC. Druhá část se~zabývala predikcí konkrétních hodnot G, kde byl vytvořený Extreme Gradient Boosting model, který získal 1.67 RMSE a 0.53 PCC. Součástí této práce byly představené 2 datasety, které jsou na sobě plně nezávislé, použitelné pro trénování a validaci modelů.
Proteins are building blocks of every living organism, as they are responsible for multiple crucial functions. They consist of amino acids chains and these chains can be changed. The change is called mutation. Mutation can happen naturally, or created in laboratory. The~aim of this thesis is to present novel methology for determining protein's stability upon mutations. It consists of two models. The first model is multi-agent system which handles classification into two classes, i.e, stabilizing and destabilizing. The best model gained 0.7~ACC and 0.41 MCC. The second part dealt with predicting exact values of G where an Extreme Gradient Boosting model was created which managed to gain 1.67 RMSE with 0.53 PCC. New datasets for training and validation, which are truly independent, were also introduced in this thesis.
Keywords:
klasifikace; mutace; protein; regrese; stabilita proteinů; strojové učení; classification; Extreme Gradient Boosting; machine learning; mutations; protein; protein stability; regression
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/207816