Název:
Multi-agentní systém pro predikci vlivu mutací na stabilitu proteinů
Překlad názvu:
Multi-Agent System for the Prediction of the Effect of Mutations on Protein Stability
Autoři:
Doseděl, Ondřej ; Martínek, Tomáš (oponent) ; Musil, Miloš (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2022
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
Proteiny jsou základním stavebním blokem všech žijících organismů, kde jsou zodpovědné za mnoho důležitých procesů. Jsou složeny z řetězců aminokyselin. Tyto řetězce mohou být jakkoliv změněné. Tomuto procesu se říká mutace a může být samovolná nebo indukovaná v laboratoři. Cílem této práce bylo vytvoření nových modelů pro určení stability proteinů. Skládá se ze dvou modelů. První model je multi-agentní systém pro klasifikaci stability proteinů. Nejlepší multi-agentní systém získal přesnost 0.7 a 0.41 MCC. Druhá část se~zabývala predikcí konkrétních hodnot G, kde byl vytvořený Extreme Gradient Boosting model, který získal 1.67 RMSE a 0.53 PCC. Součástí této práce byly představené 2 datasety, které jsou na sobě plně nezávislé, použitelné pro trénování a validaci modelů.
Proteins are building blocks of every living organism, as they are responsible for multiple crucial functions. They consist of amino acids chains and these chains can be changed. The change is called mutation. Mutation can happen naturally, or created in laboratory. The~aim of this thesis is to present novel methology for determining protein's stability upon mutations. It consists of two models. The first model is multi-agent system which handles classification into two classes, i.e, stabilizing and destabilizing. The best model gained 0.7~ACC and 0.41 MCC. The second part dealt with predicting exact values of G where an Extreme Gradient Boosting model was created which managed to gain 1.67 RMSE with 0.53 PCC. New datasets for training and validation, which are truly independent, were also introduced in this thesis.
Klíčová slova:
classification; Extreme Gradient Boosting; machine learning; mutations; protein; protein stability; regression; klasifikace; mutace; protein; regrese; stabilita proteinů; strojové učení
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/207816