Název:
Klasifikace bakterií do taxonomických kategorií na základě vlastností 16s rRNA
Překlad názvu:
Bacteria Classification into Taxonomic Categories Based on Properties of 16s rRNA
Autoři:
Grešová, Katarína ; Hon, Jiří (oponent) ; Smatana, Stanislav (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [slo][eng]
Hlavným cieľom tejto práce bolo navrhnúť a implementovať nástroj, ktorý by bol schopný klasifikovať sekvencie génu 16S rRNA do taxonomických kategórií s využitím vlastností génu 16S rRNA. Vytvorený nástroj analyzuje všetky vstupné sekvencie súčasne, čím sa líši od bežných klasifikačných prístupov, ktoré klasifikujú vstupné sekvencie jednotlivo. Tento nástroj využíva znalosť, že baktérie obsahujú niekoľko kópií génu 16S rRNA, ktoré sa môžu svojou sekvenciou odlišovať. Jedným z hlavných prínosov tejto práce je práve návrh, implementácia a vyhodnotenie schopností tohto nástroja. Experimenty ukázali, že navrhnutý nástroj je pre menšie dátové sady schopný identifikovať odpovedajúce baktérie a určiť správne pomery ich abundancií. Pri väčších dátových sadách sa však prehľadávaný priestor stáva veľmi rozsiahly a členitý, čo vyžaduje ďalšie vylepšenia navrhovaného nástroja, aby bol stavový priestor schopný prehľadávať efektívne.
The main goal of this thesis was to design and implement a tool that would be able to classify the sequences of the 16S rRNA gene into taxonomic categories using the properties of the 16S rRNA gene. The created tool analyzes all input sequences simultaneously, which differs from common classification approaches, which classify input sequences individually. This tool relies on the fact that bacteria contain several copies of the 16S rRNA gene, which may differ in sequence. The main contribution of this work is design, implementation and evaluation of the capabilities of this tool. Experiments have shown that the proposed tool is able to identify the corresponding bacteria for smaller datasets and determine the correct ratios of their abundances. However, with larger datasets, the state space becomes very large and fragmented, which requires further improvements in order for it to search the state space in an efficient way.
Klíčová slova:
16S rRNA; copies of 16S rRNA gene; metagenomics; Metropolis-Hastings; RNA secondary structure; taxonomic classification
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/192475