Název:
Detection of Correlated Mutations
Překlad názvu:
Detection of Correlated Mutations
Autoři:
Ižák, Tomáš ; Bendl, Jaroslav (oponent) ; Martínek, Tomáš (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2013
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
Tato práce zkoumá existující možnosti a metody detekce korelovaných mutací v proteinech. Práce začíná teoretickým úvodem do zkoumané problematiky. Využití informací o korelovaných mutacích je především při predikci terciální struktury proteinu či hledání oblastí s významnou funkcí. Dále následuje přehled v současnosti používaných metod detekce a jejich výhody a nevýhody. V této práci jsou zkoumány zejména metody založené na statistice (například Pearsonově korelačním koeficientu nebo Pearsonově chi^2 testu), informační teorii (Mutual information - MI) a pravděpodobnosti (ELSC nebo Spidermonkey). Dále jsou popsány nejdůležitější nástroje s informací o tom, které metody používají a jakým způsobem. Také je diskutována možnost návrhu optimálního algoritmu. Jako optimální z hlediska úspěšnosti detekce je doporučeno využít více zmíněných metod. Také je doporučeno při detekci využít fyzikálně-chemických vlastností aminokyselin. V praktické části byla vyvinuta metoda využívající fyzikálně-chemických vlastností aminokyselin a fylogenetických stromů. Výsledky detekce byly porovnány s nástroji CAPS, CRASP a CMAT.
This work explores existing possibilities and methods of correlated mutations detection in proteins. At the beginning a theoretical background into explored area is provided. Exploitation of detected correlated mutations lies in a protein's tertiary structure prediction or searching functionally important sites. A state-of-the-art of existing tools and methods follows. In this work, methods based on statistics (for example Pearson correlation coefficient or Pearson's chi^2 test), Information theory (Mutual information - MI) and likelihood models (ELSC or Spidermonkey) are examined. The next part is devoted to the searching for an optimal algorithm for correlated mutations detection. To combine results from multiple different algorithms, is proposed as an optimal solution. It is also advised to exploit physico-chemical properties of amino acids during the detection. In practical part, the algorithm for detection of correlated mutations was developed. It is based on physico-chemical properties of amino acids and phylogenetic trees. Results gained using this method were compared with results gained from CAPS, CRASP and CMAT tools.
Klíčová slova:
algorithm; co-evolution; correlated mutations; correlation; detection tools; entropy; likelihood models; mutual information; phylogeny; physico-chemical properties of amino acids; protein; statistical methods; algoritmus; entropie; fylogeneze; fyzikálně-chemické vlastnosti aminokyselin; koevoluce; korelace; korelované mutace; nástroje pro detekci; pravděpodobnostní modely; protein; statistické metody; vzájemná informace
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/53560