Název:
Porovnání eukaryotních genomů
Překlad názvu:
Eucaryotic Genomes Comparison
Autoři:
Puterová, Janka ; Vogel, Ivan (oponent) ; Martínek, Tomáš (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2015
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Hlavním motivem pro vznik této diplomové práce byla potřeba kvalitních bioinformatických nástrojů, které slouží na porovnávání genomů a vylepšení jednoho z existujících nástrojů - RepeatExplorer. Práce přináší přehled transposibilních elementů v DNA, existujících nástrojů určených pro identifikaci a analýzu repetic v nasekvenovaných genomech. V práci jsou popsány nedostatky nástroje RepeatExplorer se zaměřením na komparativní analýzu genomů. Byly navrženy a implementovány dvě řešení k odstranění těchto nedostatků. První řešení je určeno na porovnávání dvojic genomů. Princip tohoto řešení je založen na porovnávání podobnosti rozložení pokrytí contigů prostřednictvím Kolmogorov-Smirnova testu, díky čemu víme určiť rozdílné místa v genomech. Druhé řešení, které slouží k porovnávání více genomů, je založeno na metodě mapování readů porovnávaných genomů na contigy referenčního genomu a poskytuje grafy s pokrytím contigů, pomocí kterých víme určit variabilitu repetic. Funkčnost byla ověřena na reálných NGS datech organizmu Silene latifolia.
Main motive of this master thesis was the need of good bioinformatics tools for genome comparison and improvement of one of the existing tools - RepeatExplorer. This work offers an overview of transposable elements in DNA, existing tools for identification and analysis of repetitions in sequenced genomes, summary of currently used genome sequencing methods. This work describes shortcomings of RepeatExplorer tool with focus on comparative analysis of genomes. Two solutions to remove these problems were designed and implemented. The first solution is designed for comparing pairs of genomes. The principle of this solution is based on comparison of similarity of distribution of contigs coverages using Kolmogorov-Smirnov test, thanks to which we are able to determine different parts in the genomes.The second solution, which is used to compare multiple genomes, is based on the method of mapping reads from compared genomes to the reference genome contigs and provides contigs coverage graphs, by which we are able to determine the variability of the repeats.Their functionality was verified on real NGS data of organism Silene latifolia.
Klíčová slova:
LTR; NGS; porovnávání genomů; RepeatExplorer; repetice; sekvenace nové generace; shlukování; transposony; clustering; genomes comparison; LTR; next generation sequencing; NGS; repeat; RepeatExplorer; transposons
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/64044