Original title:
Klasifikace bakterií do taxonomických kategorií na základě vlastností 16s rRNA
Translated title:
Bacteria Classification into Taxonomic Categories Based on Properties of 16s rRNA
Authors:
Grešová, Katarína ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor) Document type: Master’s theses
Year:
2020
Language:
slo Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[slo][eng]
Hlavným cieľom tejto práce bolo navrhnúť a implementovať nástroj, ktorý by bol schopný klasifikovať sekvencie génu 16S rRNA do taxonomických kategórií s využitím vlastností génu 16S rRNA. Vytvorený nástroj analyzuje všetky vstupné sekvencie súčasne, čím sa líši od bežných klasifikačných prístupov, ktoré klasifikujú vstupné sekvencie jednotlivo. Tento nástroj využíva znalosť, že baktérie obsahujú niekoľko kópií génu 16S rRNA, ktoré sa môžu svojou sekvenciou odlišovať. Jedným z hlavných prínosov tejto práce je práve návrh, implementácia a vyhodnotenie schopností tohto nástroja. Experimenty ukázali, že navrhnutý nástroj je pre menšie dátové sady schopný identifikovať odpovedajúce baktérie a určiť správne pomery ich abundancií. Pri väčších dátových sadách sa však prehľadávaný priestor stáva veľmi rozsiahly a členitý, čo vyžaduje ďalšie vylepšenia navrhovaného nástroja, aby bol stavový priestor schopný prehľadávať efektívne.
The main goal of this thesis was to design and implement a tool that would be able to classify the sequences of the 16S rRNA gene into taxonomic categories using the properties of the 16S rRNA gene. The created tool analyzes all input sequences simultaneously, which differs from common classification approaches, which classify input sequences individually. This tool relies on the fact that bacteria contain several copies of the 16S rRNA gene, which may differ in sequence. The main contribution of this work is design, implementation and evaluation of the capabilities of this tool. Experiments have shown that the proposed tool is able to identify the corresponding bacteria for smaller datasets and determine the correct ratios of their abundances. However, with larger datasets, the state space becomes very large and fragmented, which requires further improvements in order for it to search the state space in an efficient way.
Keywords:
16S rRNA; copies of 16S rRNA gene; metagenomics; Metropolis-Hastings; RNA secondary structure; taxonomic classification
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/192475