National Repository of Grey Literature 5 records found  Search took 0.00 seconds. 
The use of genomic signal compression for classification and identification of organisms
Sedlář, Karel ; Vítek, Martin (referee) ; Škutková, Helena (advisor)
Modern classification of organisms is performed on molecular data. These methods rely on multiple alignment of sequences of characters which make them computationally demanding. Only small parts of genomes can be compared in reasonable time. In this paper, the novel algorithm based on conversion of the whole genome sequences to cumulative phase signals is presented. Dyadic wavelet transform is used for lossy compression of signals by redundant frequency bands elimination. Signal classification is then performed as a cluster analysis using Euclidian metrics where multiple alignment is replaced by dynamic time warping.
Methods for fast sequence comparison and identification in metagenomic data
Kupková, Kristýna ; Škutková, Helena (referee) ; Sedlář, Karel (advisor)
Předmětem této práce je vytvoření metody sloužící k identifikaci organismů z metagenomických dat. Doposud k tomuto účelu spolehlivě dostačovaly metody založené na zarovnání sekvencí s referenční databází. Množství dat ovšem s rozvojem sekvenačních technik rapidně roste a tyto metody se tak stávají díky své výpočetní náročnosti nevhodnými. V této diplomové práci je popsán postup nové techniky, která umožňuje klasifikaci metagenomických dat bez nutnosti zarovnání. Metoda spočívá v převedení sekvenovaných úseků na genomické signály ve formě fázových reprezentací, ze kterých jsou následně extrahovány vektory příznaků. Těmito příznaky jsou tři Hjorthovy deskriptory. Ty jsou dále vystaveny metodě maximalizace věrohodnosti směsi Gaussovských rozložení, která umožňuje spolehlivé roztřídění fragmentů podle jejich příslušnosti k organismu.
Signal Based Feature Selection for Fast Classification of Sequences in Metagenomics
Sedlář, Karel
The rapid development in DNA sequencing techniques brings completely new possibilities into metagenomics research. No longer is the whole metagenome sequencing an issue. On the other hand, this progress lies new demands on bioinformatics tools indented to process this kind of data. Unlike the amplicon based sequencing where every sequence represents a particular gene, the whole metagenome sequencing produce sequences that are random pieces of genomes in the metagenome. Therefore, the reference database for identification of these sequences cannot be used. Here, we present fast feature selection based on genomic signal processing for alignment-free classification of sequences in the metagenome.
Methods for fast sequence comparison and identification in metagenomic data
Kupková, Kristýna ; Škutková, Helena (referee) ; Sedlář, Karel (advisor)
Předmětem této práce je vytvoření metody sloužící k identifikaci organismů z metagenomických dat. Doposud k tomuto účelu spolehlivě dostačovaly metody založené na zarovnání sekvencí s referenční databází. Množství dat ovšem s rozvojem sekvenačních technik rapidně roste a tyto metody se tak stávají díky své výpočetní náročnosti nevhodnými. V této diplomové práci je popsán postup nové techniky, která umožňuje klasifikaci metagenomických dat bez nutnosti zarovnání. Metoda spočívá v převedení sekvenovaných úseků na genomické signály ve formě fázových reprezentací, ze kterých jsou následně extrahovány vektory příznaků. Těmito příznaky jsou tři Hjorthovy deskriptory. Ty jsou dále vystaveny metodě maximalizace věrohodnosti směsi Gaussovských rozložení, která umožňuje spolehlivé roztřídění fragmentů podle jejich příslušnosti k organismu.
The use of genomic signal compression for classification and identification of organisms
Sedlář, Karel ; Vítek, Martin (referee) ; Škutková, Helena (advisor)
Modern classification of organisms is performed on molecular data. These methods rely on multiple alignment of sequences of characters which make them computationally demanding. Only small parts of genomes can be compared in reasonable time. In this paper, the novel algorithm based on conversion of the whole genome sequences to cumulative phase signals is presented. Dyadic wavelet transform is used for lossy compression of signals by redundant frequency bands elimination. Signal classification is then performed as a cluster analysis using Euclidian metrics where multiple alignment is replaced by dynamic time warping.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.