Název:
Detekce CNV v sekvenačních datech
Překlad názvu:
CNV detection in the sequencing data
Autoři:
Pleskačová, Barbora ; Škutková, Helena (oponent) ; Jugas, Robin (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Detekci variability počtu kopií v prokaryotických organismech je v současné době věnováno čím dál více pozornosti, a to zejména díky souvislosti CNV s patogenitou a antibiotickou rezistencí bakterií. Algoritmus navržený v této práci využívá k odhalování CNV segmentů detekci extrémů v signálu s hloubkou pokrytí. Pokrytí čtení je běžně získáno mapováním osekvenovaných čtení jednoho jedince, k již známé referenční sekvenci jiného jedince stejného druhu. Dva jedinci se však vždy budou v určitém množství genů lišit, vznikají tak nenamapovaná čtení, která jsou zbytečně zahozena. Tato práce proto předpokládá, že biologická přesnost detekce CNV se dá zvýšit použitím nové reference, která je vytvořena ze stejného setu čtení jako čtení k této referenci mapovaná. Pro ověření tohoto tvrzení je využito sekvenačních čtení jedinců bakterie Klebsiella pneumoniae.
Copy number variation detection in prokaryotic organisms is currently receiving more and more attention, mainly due to the association of CNV with pathogenicity and antibiotic resistance in bacteria. The algorithm designed in this thesis uses peak detection in sequencing coverage to detect CNV segments. Read coverage is commonly obtained by mapping sequencing reads of one individual to an already known reference of another individual of the same species. However, two individuals will always differ in a certain number of genes, resulting in unmapped reads that are unnecessarily discarded. Therefore, this work assumes that the biological accuracy of CNV detection can be increased by using a new reference that is created from the same set of reads as the reads mapped to this reference. Sequencing reads of Klebsiella pneumoniae individuals are used to verify this assertion.
Klíčová slova:
CNV; pokrytí; prokaryotní genom; sekvenační čtení; strukturní variabilita; Variabilita počtu kopií; CNV; Copy number variation; coverage; prokaryotic genome; sequencing reads; structural variation
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/189153