Original title:
Využití variačních autoenkodérů pro ancestrální rekonstrukci sekvencí
Translated title:
The Application of Variational Autoencoders for Ancestral Sequence Reconstruction
Authors:
Kohout, Pavel ; Martínek, Tomáš (referee) ; Musil, Miloš (advisor) Document type: Master’s theses
Year:
2022
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Proteinové inženýrství je interdisciplinární vědní obor zabývající se návrhem vylepšených proteinů. Úspěšnou metodou využívanou pro návrh stabilnějších a aktivnějších proteinů je ancestrální rekonstrukce sekvencí. Tato metoda zkoumá evoluční vztahy mezi existujícími proteiny a za pomoci fylogenetických stromů vytváří jejich evoluční předchůdce, které kýžené vylepšené vlastnosti často vykazují. Proto nové a robustnější metody využívající matematické modely společně s obrovským množstvím sekvenčních dat by se mohly stát mocným nástrojem proteinového inženýrství. Tato diplomové práce se zabývá použitím variačních autoenkodérů jako alternativního přístupu k návrhu ancestrálních sekvencí oproti konvenčním metodám využívajícím fylogenetické stromy. V práci byly provedeny experimenty pro optimalizaci architektury a navrženy statistické metody pro evaluaci kvality modelů a generovaných sekvencí. Současně byly provedeny zkoušky robustnosti celé metody a navrhnuty a implementovány strategie pro generaci sekvence předků.
Protein engineering is an interdisciplinary science concerned with the design of improved proteins. A successful method used to design more stable and active proteins is ancestral sequence reconstruction. This method explores the evolutionary relationships between existing proteins and uses phylogenetic trees to generate their evolutionary ancestors, which often exhibit the desired improved properties. Therefore, new and more robust methods using mathematical models together with huge amounts of sequence data could become a powerful tool for protein engineering. This thesis explores the use of variational autoencoders as an alternative approach to ancestral sequence design compared to conventional methods using phylogenetic trees. Experiments were performed to optimize the architecture and statistical methods were proposed to evaluate the quality of the models and the sequences generated. At the same time, robustness tests of the whole method were performed and strategies for ancestral sequence generation were proposed and implemented.
Keywords:
ancestral reconstruction; bioinformatics; generative models; machine learning; protein engineering; protein optimization; variational autoencoders; ancestrální rekonstrukce; bioinformatika; generativní modely; optimalizace proteinů; proteinové inženýrství; strojové učení; variační autoenkodéry
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/207884