Název:
Využití variačních autoenkodérů pro ancestrální rekonstrukci sekvencí
Překlad názvu:
The Application of Variational Autoencoders for Ancestral Sequence Reconstruction
Autoři:
Kohout, Pavel ; Martínek, Tomáš (oponent) ; Musil, Miloš (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2022
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Proteinové inženýrství je interdisciplinární vědní obor zabývající se návrhem vylepšených proteinů. Úspěšnou metodou využívanou pro návrh stabilnějších a aktivnějších proteinů je ancestrální rekonstrukce sekvencí. Tato metoda zkoumá evoluční vztahy mezi existujícími proteiny a za pomoci fylogenetických stromů vytváří jejich evoluční předchůdce, které kýžené vylepšené vlastnosti často vykazují. Proto nové a robustnější metody využívající matematické modely společně s obrovským množstvím sekvenčních dat by se mohly stát mocným nástrojem proteinového inženýrství. Tato diplomové práce se zabývá použitím variačních autoenkodérů jako alternativního přístupu k návrhu ancestrálních sekvencí oproti konvenčním metodám využívajícím fylogenetické stromy. V práci byly provedeny experimenty pro optimalizaci architektury a navrženy statistické metody pro evaluaci kvality modelů a generovaných sekvencí. Současně byly provedeny zkoušky robustnosti celé metody a navrhnuty a implementovány strategie pro generaci sekvence předků.
Protein engineering is an interdisciplinary science concerned with the design of improved proteins. A successful method used to design more stable and active proteins is ancestral sequence reconstruction. This method explores the evolutionary relationships between existing proteins and uses phylogenetic trees to generate their evolutionary ancestors, which often exhibit the desired improved properties. Therefore, new and more robust methods using mathematical models together with huge amounts of sequence data could become a powerful tool for protein engineering. This thesis explores the use of variational autoencoders as an alternative approach to ancestral sequence design compared to conventional methods using phylogenetic trees. Experiments were performed to optimize the architecture and statistical methods were proposed to evaluate the quality of the models and the sequences generated. At the same time, robustness tests of the whole method were performed and strategies for ancestral sequence generation were proposed and implemented.
Klíčová slova:
ancestrální rekonstrukce; bioinformatika; generativní modely; optimalizace proteinů; proteinové inženýrství; strojové učení; variační autoenkodéry; ancestral reconstruction; bioinformatics; generative models; machine learning; protein engineering; protein optimization; variational autoencoders
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/207884