Název:
Identifikace genů ve squigglech ze sekvenace nanopórem
Překlad názvu:
Gene identification in nanopore squiggles
Autoři:
Talanin, Nikita ; Nykrýnová, Markéta (oponent) ; Bartoň, Vojtěch (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2023
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Sekvenace nanopórem je nová a rychle se rozvíjející technologie, která umožňuje přímé sekvenování jednovláknové DNA a RNA v reálném čase. Výsledkem sekvenace je takzvaný squiggle, což je časová řada intenzit proudů při průchodu nukleotidů nanopórem. Identifikace genů v těchto squigglech je klíčovým krokem pro využití těchto dat v genomických studiích. Tato bakalářská práce se zabývá vývojem a testováním metody pro automatickou identifikaci genů ve squigglech ze sekvenace nanopórem. Cílem bylo vytvořit systém, který by mohl rychle a přesně identifikovat geny v squigglech, a tím podpořit další analýzy a interpretaci dat z nanopórové sekvenace. Metoda využívá konvoluční neuronové sítě (CNN), které byly úspěšně použity v mnoha jiných oblastech bioinformatiky. Pro trénování modelu byl použit velký dataset squigglů, které byly označeny podle genu, který reprezentují. Výsledky ukazují, že systém je schopen s určitou přesností identifikovat geny ve squigglech a že může být účinným nástrojem pro analýzu dat z nanopórové sekvenace.
Nanopore sequencing is a new and rapidly developing technology that allows for the direct sequencing of single-stranded DNA and RNA in real-time. The result of the sequencing is the so-called squiggle, which is a time series of current intensities as nucleotides pass through the nanopore. Identifying genes in these squiggles is a crucial step for the utilization of this data in genomic studies. This bachelor's thesis focuses on the development and testing of a method for automatic gene identification in squiggles from nanopore sequencing. The aim was to create a system capable of quickly and accurately identifying genes in squiggles, thereby supporting further analysis and interpretation of nanopore sequencing data. The method utilizes Convolutional Neural Networks (CNN), which have been successfully used in many other areas of bioinformatics. A large dataset of squiggles, labeled according to the gene they represent, was used to train the model. The results show that the system can identify genes in squiggles with a certain level of accuracy and can be an effective tool for nanopore sequencing data analysis
Klíčová slova:
bioinformatika; klasifikace genů; Nanopore sekvenování; bioinformatics; gene classification; Nanopore sequencing
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/213844