Název:
Predikce sekundární struktury proteinu pomocí hlubokých neuronových sítí
Překlad názvu:
Protein secondary structure prediction using deep neural networks
Autoři:
Filippi, Michal ; Hoksza, David (vedoucí práce) ; Matzner, Filip (oponent) Typ dokumentu: Diplomové práce
Rok:
2017
Jazyk:
cze
Abstrakt: [cze][eng] Znalost struktury, kterou proteiny zaujímají v prostoru, je klíčovým faktorem při studiu jejich funkce. Experimentální zjištění struktury je ale nákladné a časově náročné, proto jsou velmi populární predikční modely struktury. Nejvýraznějším podproblémem predikce struktury proteinů je predikce lokálního uspořádání sou- sedících aminokyselin určeného vodíkovými vazbami, tzv. sekundární struktury proteinů. Tato práce se zaměřuje na využití hlubokých neuronových sítí v pre- dikci sekundární struktury. Na implementovaném predikčním modelu jsou v rámci této práce testovány různé modifikace sítě, především je pak provedeno srovnání LSTM a GRU paměťových buněk. Dále jsou zkoumány nové metody předzpraco- vání proteinů, a to zrychlení klasické metody výpočtu PSSM a zahrnutí predikce terciární struktury mezi vstupy predikčního modelu. V poslední části práce je ověřována použitelnost vyhlazovacích metod pro modely predikující složitější os- mistavové rozdělení sekundárních struktur. 1Determination of protein structure in space is a crucial part of protein function analysis. But structure determination is an expensive and time consuming pro- cess, therefore structure prediction model raised on popularity. The most notable subproblem of protein structure prediction is prediction of local conformation of the adjacent amino acids, ie. secondary structure. This thesis studies usage of deep neural networks for protein secondary structure prediction. We implemented pre- diction model and different modifications are evaluated. Especially compassion of LSTM and GRU memory cells was done. Furthermore, two new preprocessing me- thods are evaluated. Fast PSSM calculation method was proposed and prediction of tertiary structure was used as input for prediction model. Last part of this thesis examine application of filtering methods for models predicting secondary structure with eight classes. 1
Klíčová slova:
bioinformatika; neuronové sítě; protein; sekundární struktura; strojové učení; bioinformatics; machine learning; neural networks; protein; secondary structure