Název:
Určování genetických variant z masivně paralelních sekvenačních dat pomocí lokálních reassembly
Překlad názvu:
Variant calling using local reference-helped assemblies
Autoři:
Dráb, Martin ; Daněček, Petr (vedoucí práce) ; Hoksza, David (oponent) Typ dokumentu: Diplomové práce
Rok:
2017
Jazyk:
eng
Abstrakt: [eng][cze] Despite active development during past years, the task of sequencing a genome still remains a challenge. Our current technologies are not able to read the whole genome in one piece. Instead, we shatter the target genome into a large amounts of small pieces that are then sequenced separately. The process of assembling these small pieces together, in order to obtain sequence of the whole genome, is painful and rsource-consuming. Multiple algorithms to solve the assembly problem were developed. This thesis presents yet another assembly algorithm, based on the usage of de Bruijn graphs, and focusing on sequencing short genome regions. The algorithm is compared to well-known solutions in the field. 1I přes aktivní vývoj v posledních letech čtení genomu organismů stále patří mez- i těžké problémy. S dostupnými technologiemi nejsme schopni přečíst zadaný genom jako celek. Obvyklý postup spočívá v jeho rozbití na velké množství malých částí, které dokážeme jednotlivě přečíst. Následuje bolestivý proces je- jich opětovného skládání do podoby výsledného genomu. Tato práce prezentuje algoritmus pro skládání genomu založený na principu de Bruijnových grafů a porovnává jeho výsledky s již existujícími řešeními. Algorit- mus se zaměřuje na krátké úseky genomu a využívá znalosti referenční sekvence. 1
Klíčová slova:
De Bruijn grafy; high-throughput sequencing; local assembly; variant calling; De Bruijn graphs; high-throughput sequencing; local assembly; variant calling