Original title:
Statistické vyhodnocení fylogeneze biologických sekvencí
Translated title:
Statistic evaluation of phylogeny of biological sequences
Authors:
Zembol, Filip ; Provazník, Ivo (referee) ; Škutková, Helena (advisor) Document type: Master’s theses
Year:
2013
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Tématem této diplomové práce je statistické vyhodnocení fylogeneze biologických sekvencí pomocí fylogenetických stromů. V teoretické části vypracujeme literární rešerši metodologie odhadu průběhu fylogeneze na základě podobnosti biologických sekvencí (DNA a bílkovin), kde se zaměříme na nepřesnosti v odhadu, čím jsou způsobeny a na možnosti jejich odstranění. Poté srovnáme metody pro statistické vyhodnocení správnosti průběhu fylogeneze. V praktické části navrhneme algoritmy, které budou sloužit pro testování věrohodnosti konstrukce fylogenetických stromů na základě bootstrappingu, jackknifingu, OTU jackknifingu a PTP testu, které budou schopny z biologických sekvencí ve FASTA kódu vykreslit fylogenetický strom metodou neighbor joining a lze také měnit distanční model a substituční matici. Abychom mohli tyto algoritmy použít pro statistickou podporu fylogenetických stromů, musíme ověřit jejich správnou funkci. Toto ověření vyhodnotíme na teoretických sekvencích aminokyselin. Po ověření správné funkce algoritmů, si demonstrujeme jednotlivé statistické testy na reálných 10 sekvencích ubikvitinu savců. Tyto výsledky analyzujeme a vhodně okomentujeme.
The topic of my diploma thesis is the statistical evaluation of biological sequences with the help of phylogenic trees. In the theoretical part we will create a literary recherche of estimation methodology concerning the course of phylogeny on the basis of the similarity of biological sequences (DNA and proteins) and we will focus on the inaccuracies of the estimation, their causes and the possibilities of their elimination. Afterwards, we will compare the methods for the statistical evaluation of the correctness of the course of phylogeny. In the practical part of the thesis we will suggest algorithms that will be used for testing the correctness of the phylogenic trees on the basis of bootstrapping, jackknifing, OTU jackknifing and PTP test which are able to the capture phylogenic tree with the method neighbor joining from the biological sequences in FASTA code. It is also possible to change the distance model and the substitution matrix. To be able to use these algorithms for the statistical support of phylogenic trees we have to verify their right function. This verification will be evaluated on the theoretical sequences of the amino acids. For the verification of the correct function of the algorithms, we will carry out single statistical tests on real 10 sequences of mammalian ubiquitin. These results will be analysed and appropriately discussed.
Keywords:
bootstrapping; dendrogram; jackknifing; Jukes - Cantor; Neighbor joining; OTU jackknifing; Phylogenetic tree; PTP; taxonomic unit; bootstrapping; dendrogram; Fylogenetický strom; jackknifing; Jukes - Cantor; Neighbor joining; OTU jackknifing; PTP; substituční matice; taxon
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/25939