Original title:
Rekonstrukce DNA sekvencí obsahujících opakující se vzory
Translated title:
Reconstruction of DNA Sequences Containing Repetitive Patterns
Authors:
Dvořáček, Vojtěch ; Vogel, Ivan (referee) ; Martínek, Tomáš (advisor) Document type: Bachelor's theses
Year:
2014
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato bakalářská práce se zabývá rekonstrukcí repetitivních motivů v genomových sekvencích. Motivací jejího vzniku byla potřeba vytvořit automatizovaný nástroj pro charakterizaci telomerických sekvencí v rostlinných genech. Práce se však zabývá obecným řešením dané problematiky. Navržené řešení je založeno na k-merové analýze, řadící se mezi metody nevyužívající zarovnání. Největší výhodou této metody je schopnost rekonstruovat repetitivní motivy z NGS sekvenačních dat. V rámci práce bylo navrženo a implementováno řešení, které umožňuje automatizovaně volit vhodné parametry pro k-merovou analýzu jejich odvozením ze vstupních dat a následně jejich optimalizací pomocí lokálního prohledávání stavového prostoru.
This bachelor thesis focuses on reconstruction of repetitive patterns in DNA sequences. Although it is motivated by need to create automated tool for telomere characterization in plant genomes, its goal is creating general solution of given problem. Suggested solution is based on k-mer analysis, which is alignment free method. Its greatest advantage lies in possibility to reconstruct repetitive patterns from NGS sequencing data. Within the scope of this work was designed and iplemented solution, which is able to automatically estiamte suitable parametres for k-mer analysis from input data and optimize them by local state space search method.
Keywords:
DNA; k-mer analysis; NGS; optimization; reconstruction; repetitive pattern; DNA; k-merová analýza; NGS; optimalizace; rekonstrukce; repetice
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/56621