|
Methods for fast sequence comparison and identification in metagenomic data
Kupková, Kristýna ; Škutková, Helena (oponent) ; Sedlář, Karel (vedoucí práce)
The objective of this thesis is to create a method for identification of organisms in metagenomic data. Until this point methods based on sequence alignment with reference database have been sufficient for this purpose. However, the volume of data grows rapidly with evolvement of sequencing techniques and the alignment-based methods became inconvenient due to computationally demanding alignment. A new technique is introduced in this master’s thesis, which allows alignment-free metagenomic data classification. The method is based on transformation of sequences to genomic signals in form of phase representation, from which feature vectors are extracted. These features are three Hjorth descriptors, which are then subjected expectation maximization for Gaussian mixture model method allowing reliable binning of metagenomic data.
|
|
Metagenomická analýza vývoje střevního mikrobiomu dětí
Zourková, Tereza ; Škutková, Helena (oponent) ; Bartoň, Vojtěch (vedoucí práce)
Práce pojednává o vlivu metagenomu na vývoj dítěte a o důvodech přínosnosti zkoumání následků změn lidského střevního mikrobiomu. Následně je v práci nastíněna obecná problematika mikrobiomu a historie jeho studií. Také je zde popsáno složení lidského mikrobiomu střev a souvislosti s imunitním systémem nebo například produkcí hormonů. Rovněž práce obsahuje informace o vybraných metodách analýzy metagenomu, konkrétně mikroskopické metody využívající předchozí kultivaci, hmotnostní spektrometrie a metody sekvenační. Je zde popsán také postup analýzy dat pomocí dostupných bioinformatických nástrojů, kterými byla data vhodně předzpracována. Takto vyfiltrovaná data byla připravena pro navazující profilaci metagenomu, která je v práci podrobně popsána. Na závěr práce jsou vyhodnoceny výsledky profilace, na základě kterých jsou odhadnuty průběhy změn mikrobiomu během vývoje dítěte, což je hlavním cílem této bakalářské práce.
|
| |
|
Methods for fast sequence comparison and identification in metagenomic data
Kupková, Kristýna ; Škutková, Helena (oponent) ; Sedlář, Karel (vedoucí práce)
The objective of this thesis is to create a method for identification of organisms in metagenomic data. Until this point methods based on sequence alignment with reference database have been sufficient for this purpose. However, the volume of data grows rapidly with evolvement of sequencing techniques and the alignment-based methods became inconvenient due to computationally demanding alignment. A new technique is introduced in this master’s thesis, which allows alignment-free metagenomic data classification. The method is based on transformation of sequences to genomic signals in form of phase representation, from which feature vectors are extracted. These features are three Hjorth descriptors, which are then subjected expectation maximization for Gaussian mixture model method allowing reliable binning of metagenomic data.
|