Název:
Statistické vyhodnocení fylogeneze biologických sekvencí
Překlad názvu:
Statistic evaluation of phylogeny of biological sequences
Autoři:
Zembol, Filip ; Provazník, Ivo (oponent) ; Škutková, Helena (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2013
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Tématem této diplomové práce je statistické vyhodnocení fylogeneze biologických sekvencí pomocí fylogenetických stromů. V teoretické části vypracujeme literární rešerši metodologie odhadu průběhu fylogeneze na základě podobnosti biologických sekvencí (DNA a bílkovin), kde se zaměříme na nepřesnosti v odhadu, čím jsou způsobeny a na možnosti jejich odstranění. Poté srovnáme metody pro statistické vyhodnocení správnosti průběhu fylogeneze. V praktické části navrhneme algoritmy, které budou sloužit pro testování věrohodnosti konstrukce fylogenetických stromů na základě bootstrappingu, jackknifingu, OTU jackknifingu a PTP testu, které budou schopny z biologických sekvencí ve FASTA kódu vykreslit fylogenetický strom metodou neighbor joining a lze také měnit distanční model a substituční matici. Abychom mohli tyto algoritmy použít pro statistickou podporu fylogenetických stromů, musíme ověřit jejich správnou funkci. Toto ověření vyhodnotíme na teoretických sekvencích aminokyselin. Po ověření správné funkce algoritmů, si demonstrujeme jednotlivé statistické testy na reálných 10 sekvencích ubikvitinu savců. Tyto výsledky analyzujeme a vhodně okomentujeme.
The topic of my diploma thesis is the statistical evaluation of biological sequences with the help of phylogenic trees. In the theoretical part we will create a literary recherche of estimation methodology concerning the course of phylogeny on the basis of the similarity of biological sequences (DNA and proteins) and we will focus on the inaccuracies of the estimation, their causes and the possibilities of their elimination. Afterwards, we will compare the methods for the statistical evaluation of the correctness of the course of phylogeny. In the practical part of the thesis we will suggest algorithms that will be used for testing the correctness of the phylogenic trees on the basis of bootstrapping, jackknifing, OTU jackknifing and PTP test which are able to the capture phylogenic tree with the method neighbor joining from the biological sequences in FASTA code. It is also possible to change the distance model and the substitution matrix. To be able to use these algorithms for the statistical support of phylogenic trees we have to verify their right function. This verification will be evaluated on the theoretical sequences of the amino acids. For the verification of the correct function of the algorithms, we will carry out single statistical tests on real 10 sequences of mammalian ubiquitin. These results will be analysed and appropriately discussed.
Klíčová slova:
bootstrapping; dendrogram; Fylogenetický strom; jackknifing; Jukes - Cantor; Neighbor joining; OTU jackknifing; PTP; substituční matice; taxon; bootstrapping; dendrogram; jackknifing; Jukes - Cantor; Neighbor joining; OTU jackknifing; Phylogenetic tree; PTP; taxonomic unit
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/25939