Název:
Pokročilé výpočetní metody pro detekci CNV v bakteriálních genomech
Překlad názvu:
Advanced Computational Methods for CNV Detection in Bacterial Genomes
Autoři:
Jugas, Robin ; Bystrý, Vojtěch (oponent) ; Šafránek,, David (oponent) ; Vítková, Helena (vedoucí práce) Typ dokumentu: Disertační práce
Rok:
2024
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [eng][cze]
Hlavní pozornost v oblasti strukturálních variací je zaměřena na lidské genomy. Detekce změny variace počtu kopií (CNV) u bakterií je tedy méně rozvinutou oblastí. Běžně používané metody detekce CNV neberou v úvahu specifika bakteriálních kruhových genomů a obecně existuje prostor pro zlepšení metrik výkonnosti. Tato práce představuje metodu detekce CNV nazvanou CNproScan zaměřenou na bakteriální genomy. CNproScan implementuje hybridní přístup kombinující signály hloubky čtení a párů čtení. Bere v potaz všechny vlastnosti bakterií a využívá pouze sekvenační data. Na základě výsledků ze srovnání dosáhl CNproScan velmi dobrých výsledků v různých podmínkách. Pomocí informací z párových čtení jsou CNV klasifikovány do několika kategorií. Ve srovnání s jinými metodami může CNproScan také detekovat mnohem kratší CNV. Vzhledem k nutnosti slučovat nejen signály různých přístupů, ale také výsledky různých algoritmů, dizertační práce také představuje pipelinu nazvanou ProcaryaSV vyvinutou k detekci CNV s využitim pěti nástrojů a slučování jejich výsledků. ProcaryaSV se stará o celý postup od kontroly kvality čtení, ořezávání konců čtení, zarovnání čtení až k detekci CNV.
The focus in the field of structural variations is mainly focused on human genomes. Thus, detecting copy number variation (CNV) in bacteria is a less developed field. Commonly used CNV detection methods do not consider the features of bacterial circular genomes and generally, there is a space to improve performance metrics. This thesis presents a CNV detection method called CNproScan focused on bacterial genomes. CNproScan implements a hybrid approach combining read depth and read pair signals. It considers all bacteria features and depends only on NGS data. Based on the benchmarking results, the CNproScan achieved very well in various conditions. Using the read pair information, the CNVs are classified into several categories. Also, compared with other methods, CNproScan can detect much shorter CNV events. Because of the necessity of merging not only the various feature signals but also the results of different algorithms, the thesis also introduces a pipeline called ProcaryaSV developed to easily employ five CNV detection tools and merge their results. ProcaryaSV handles the whole procedure from quality check, reads trimming, and alignment to the CNV calling.
Klíčová slova:
Bacteria; Copy number variation; Next-generation sequencing; Structural variation; bakterie; sekvenování nové generace; strukturální variace; variace počtu kopií
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: https://hdl.handle.net/11012/245250