Original title:
Detekce CNV v sekvenačních datech
Translated title:
CNV detection in the sequencing data
Authors:
Pleskačová, Barbora ; Škutková, Helena (referee) ; Jugas, Robin (advisor) Document type: Master’s theses
Year:
2020
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Detekci variability počtu kopií v prokaryotických organismech je v současné době věnováno čím dál více pozornosti, a to zejména díky souvislosti CNV s patogenitou a antibiotickou rezistencí bakterií. Algoritmus navržený v této práci využívá k odhalování CNV segmentů detekci extrémů v signálu s hloubkou pokrytí. Pokrytí čtení je běžně získáno mapováním osekvenovaných čtení jednoho jedince, k již známé referenční sekvenci jiného jedince stejného druhu. Dva jedinci se však vždy budou v určitém množství genů lišit, vznikají tak nenamapovaná čtení, která jsou zbytečně zahozena. Tato práce proto předpokládá, že biologická přesnost detekce CNV se dá zvýšit použitím nové reference, která je vytvořena ze stejného setu čtení jako čtení k této referenci mapovaná. Pro ověření tohoto tvrzení je využito sekvenačních čtení jedinců bakterie Klebsiella pneumoniae.
Copy number variation detection in prokaryotic organisms is currently receiving more and more attention, mainly due to the association of CNV with pathogenicity and antibiotic resistance in bacteria. The algorithm designed in this thesis uses peak detection in sequencing coverage to detect CNV segments. Read coverage is commonly obtained by mapping sequencing reads of one individual to an already known reference of another individual of the same species. However, two individuals will always differ in a certain number of genes, resulting in unmapped reads that are unnecessarily discarded. Therefore, this work assumes that the biological accuracy of CNV detection can be increased by using a new reference that is created from the same set of reads as the reads mapped to this reference. Sequencing reads of Klebsiella pneumoniae individuals are used to verify this assertion.
Keywords:
CNV; Copy number variation; coverage; prokaryotic genome; sequencing reads; structural variation; CNV; pokrytí; prokaryotní genom; sekvenační čtení; strukturní variabilita; Variabilita počtu kopií
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/189153