Název: Development of algorithms for the analysis of duplex sequencing data
Autoři: HEINZL, Monika
Typ dokumentu: Bakalářské práce
Rok: 2018
Jazyk: eng
Abstrakt: Duplex sequencing detects ultra-rare mutations by tagging DNA molecules with double-stranded tags. This method creates single-stranded consensus sequences (SSCS) from the reads, which then form duplex consensus sequences (DCS) and are then aligned to the reference genome to call mutations. During this process, a large amount of sequencing data is lost. Therefore, we have developed new algorithms, that give insight in the sequencing data which helps to improve the reads/SSCS/DCS ratios. In addition, a graphical representation of the sequencing data was implemented. The first part of the thesis is focusing on the distribution of sizes of read families. Second, a detailed analysis of the tags is shown by calculating their Hamming distances which can identify sequencing or PCR errors from true molecules. In addition, we can detect artificial produced chimeric reads during PCR. The fourth part includes the application of our algorithms on shorter tag lengths and on only those tags which are involved in the formation of DCSs. Finally, we investigated different sources of read loss during data analysis.
Klíčová slova: chimeric reads; data analysis; duplex sequencing; Hamming distance; mutations; read family size
Citace: HEINZL, Monika. Development of algorithms for the analysis of duplex sequencing data. České Budějovice, 2018. bakalářská práce (Bc.). JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH. Přírodovědecká fakulta

Instituce: Jihočeská univerzita v Českých Budějovicích (web)
Informace o dostupnosti dokumentu: Plný text je dostupný v digitálním repozitáři JČU.
Původní záznam: http://www.jcu.cz/vskp/53028

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-383524


Záznam je zařazen do těchto sbírek:
Školství > Veřejné vysoké školy > Jihočeská univerzita v Českých Budějovicích
Vysokoškolské kvalifikační práce > Bakalářské práce
 Záznam vytvořen dne 2018-07-30, naposledy upraven 2023-01-15.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet