Název:
Analýza single-cell genomických dat Saccinobaculus sp.
Překlad názvu:
Analysis of single-cell genomic data of Saccinobaculus sp.
Autoři:
Gajdošová, Petra ; Treitli, Sebastian Cristian (vedoucí práce) ; Kolísko, Martin (oponent) Typ dokumentu: Diplomové práce
Rok:
2023
Jazyk:
eng
Abstrakt: [eng][cze] The progress of single-cell genomics and metagenomics techniques allows us to explore the uncultured organisms in greater depth. In this work, we focused on the genome assembly and genetic code of the oxymonad Sacinobaculus ambloaxostylus, which inhabits the hindgut of wood-eating cockroaches from the genus Cryptocercus. Using single cell picking and whole genome amplification we obtained sequencing data from three cells of S. ambloaxostylus. The obtained data was used to generate a single-cell genome assembly using SPAdes. The assembly was further binned and decontaminated to remove any potential bacterial or eukaryotic contaminants. After decontamination and re-assembly, we obtained a genome assembly with a total length of ∼417Mbp distributed to ∼185 thousand scaffolds. Despite its low completeness of 13.71%, we attempted to determine the genetic code used by S. ambloaxostylus. For this we manually modeled 33 genes from various metabolic pathways. Aligning these gene models with homologs from closely related oxymonads, we calculated the usage of stop codons as sense codons with focus on conserved positions. Our results suggest that the stop codons UAA and UAG act as sense codons and most probably they encode glutamine. Our 18S rRNA phylogeny was unable to answer the question if the ciliate...Pokrok v metodách jednobuněčné genomiky a metagenomiky nám umožňuje prozk- oumat nekultivovatelné organizmy mnohem podrobněji. V této práci se zaměřujeme na sestavení genomu a genetický kód druhu Saccinobaculus ambloaxostylus ze skupiny oxymonád, který obývá zadní střevo dřevožravých švábů rodu Cryptocercus. Pomocí celogenomové amplifikace jsme získali sekvenční data tří vybraných buněk S. ambloax- ostylus. Získaná data byla použita k sestavení genomu za použití programu SPAdes. Sestavený genom byl následně rozdělen do přihrádek "košů" a dekontaminován, abychom odstranili potenciální bakteriální nebo eukaryotickou kontaminaci. Po dekontaminaci a opětovném sestavení genomu jsme získali genom s celkovou délkou ∼417Mbp, který byl distribuován mezi ∼185 tisíc fragmentů. I přes to, že jsme získali jenom částečný genom s předpokládanou úplností 13,71%, jsme se pokusili určit genetický kód, který používá S. ambloaxostylus. K tomu jsme vymodelovali 33 genů z různých metabolických drah. Porovnáním genových modelů a konzervovaných úseků u homologických proteinů příbuzných oxymonád jsme odhadli, jaké aminokyseliny kódují kanonické stop kodony. Naše výsledky naznačují, že tento organizmus používá genetický kód č. 6 známý napřík- lad u nálevníků, ve kterém jsou stop kodony UAA a UAG přeloženy jako glutamin....
Klíčová slova:
assembly; binning; funkční anotace; predikce genů; Single-cell genomika; assembly; binning; functional annotation; gene prediction; Single-cell genomics