Original title:
Využití grafových neuronových sítí pro detekci protein-ligand vazebných míst
Translated title:
Detection of protein-ligand binding sites using graph neural networks
Authors:
Gamouh, Hamza ; Hoksza, David (advisor) ; Pilát, Martin (referee) Document type: Master’s theses
Year:
2022
Language:
eng Abstract:
[eng][cze] The function of most biological systems is realized by the interaction of proteins with other biological molecules. Protein-ligand binding is one of the most im- portant kind of interactions which, if studied well, can reveal a lot of hidden causal patterns behind biological functions, and can contribute to the rapid de- velopment of drug research. Protein-ligand binding sites detection is one aspect of the general study of protein-ligand interactions, where the goal is to develop computational methods that can use ligand as well as protein structure, possibly together with its sequence data, to predict regions of the protein that can bind to potential ligands. The significant growth of protein structure databases, such as, Protein Data Bank (PDB) and sequence databases like Universal Protein Re- source (UniProt), has led to the development of different machine learning and deep learning approaches that make use of this huge amount of biological data to solve this task. In this thesis, we examine a deep learning method based on a recent model architecture called Graph Convolutional Networks (GCN), which combines the traditional Convolutional Neural Network (CNN) architecture, and the more recent Graph Neural Network (GNN) architecture which has been suc- cessful in solving various chemoinformatics...Funkce většiny biologických systémů je realizována interakcí proteinů s jinými bi- ologickými molekulami. Vazba protein-ligand je jedním z nejdůležitějších druhů interakcí, které, pokud jsou dobře prostudovány, mohou odhalit mnoho skrytých kauzálních vzorců za biologickými funkcemi a mohou přispět k rychlému rozvo- ji výzkumu léčiv. Detekce vazebných míst protein-ligand je jedním z aspektů interakcí protein-ligand, kde je cílem vyvinout výpočetní metody, které mo- hou používat ligand i strukturu proteinu, případně spolu s jeho sekvenčními údaji, k predikci oblastí proteinu, které se mohou vázat na potenciál. ligandy. Významný nárůst databází proteinových struktur, jako je Protein Data Bank (PDB) a sekvenčních databází, jako je Universal Protein Resource (UniProt), vedl k vývoji různých přístupů strojového učení a hlubokého učení, které využívají toto obrovské množství biologických data k řešení tohoto úkolu. V této práci zk- oumáme metodu hlubokého učení založenou na nedávné modelové architektuře zvané Graph Convolutional Networks (GCN), která kombinuje tradiční architek- turu konvolučních neuronových sítí (CNN) a novější architekturu Graph Neu- ral Network (GNN), která byla úspěšní...
Keywords:
binding sites|protein-ligand binding sites|binding sites prediction|Graph Neural Networks|Graph Convolutional Networks|residue-level prediction|node features|protein|structure; bioinformatika|grafové neuronové sítě|protein|struktura
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/175666