Original title:
Určování genetických variant z masivně paralelních sekvenačních dat pomocí lokálních reassembly
Translated title:
Variant calling using local reference-helped assemblies
Authors:
Dráb, Martin ; Daněček, Petr (advisor) ; Hoksza, David (referee) Document type: Master’s theses
Year:
2017
Language:
eng Abstract:
[eng][cze] Despite active development during past years, the task of sequencing a genome still remains a challenge. Our current technologies are not able to read the whole genome in one piece. Instead, we shatter the target genome into a large amounts of small pieces that are then sequenced separately. The process of assembling these small pieces together, in order to obtain sequence of the whole genome, is painful and rsource-consuming. Multiple algorithms to solve the assembly problem were developed. This thesis presents yet another assembly algorithm, based on the usage of de Bruijn graphs, and focusing on sequencing short genome regions. The algorithm is compared to well-known solutions in the field. 1I přes aktivní vývoj v posledních letech čtení genomu organismů stále patří mez- i těžké problémy. S dostupnými technologiemi nejsme schopni přečíst zadaný genom jako celek. Obvyklý postup spočívá v jeho rozbití na velké množství malých částí, které dokážeme jednotlivě přečíst. Následuje bolestivý proces je- jich opětovného skládání do podoby výsledného genomu. Tato práce prezentuje algoritmus pro skládání genomu založený na principu de Bruijnových grafů a porovnává jeho výsledky s již existujícími řešeními. Algorit- mus se zaměřuje na krátké úseky genomu a využívá znalosti referenční sekvence. 1
Keywords:
De Bruijn graphs; high-throughput sequencing; local assembly; variant calling; De Bruijn grafy; high-throughput sequencing; local assembly; variant calling
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/90478