Název:
Bioinformatická analýza dat hmotnostní spektrometrie v metabolomice
Překlad názvu:
Bioinformatic analysis of mass spectrometry data in metabolomics
Autoři:
Skoryk, Maksym ; Raček,, Tomáš (oponent) ; Mgr. Aleš Křenek, Ph.D (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2023
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta chemická
Abstrakt: [eng][cze]
Náplní této diplomové práce je zkoumání a porovnání metod pro analýzu dat hmotnostní spektrometrie se zaměřením na konstruování a interpretace molekulárních sítí. Primárním cílem tohoto výzkumu je identifikace vhodných metrik shodnosti hmotnostních spekter pro vytváření molekulárních sítí, které by odhalily smysluplné vztahy mezi sloučeninami a jejich strukturními a biologickými vlastnostmi. Pro dosažení stanoveného cíle důkladně jsme prozkoumáli výkonnost různých metrik podobností hmotnostních spekter, včetně kosinové podobnosti, spektrální entropie, Spec2Vec a také Spec2Vec a MS2DeepScore založených na metodách strojového učení. Následně jsme použili techniky redukce rozměrů, jako je t-SNE, UMAP, PHATE a Isomap, abychom vizualizovali a lépe porozuměli molekulárním sítím generovaným z těchto metrik. Získané výsledky demonstrují důležitost výběru vhodných metrik podobností a jejich úpravy pro konkrétní datové sady. Tato práce přispívá k oblasti necílené hmotnostní spektrometrie a metabolomiky zkoumáním aplikací molekulárních sítí na datech elektronově-ionizační plynové chromatografií-hmotnostní spektrometrie.
This Master's thesis explores and compares methods for the analysis of mass spectrometry data, focusing on the construction and application of molecular networks. The primary objective of this study is to identify suitable mass spectra similarity metrics for the construction of molecular networks, which would reveal meaningful relationships between compounds and their structural and biological properties. To achieve this goal, we thoroughly investigated the performance of different mass spectra similarity metrics, including cosine similarity, spectral entropy, as well as machine learning-based Spec2Vec, and MS2DeepScore. We then applied dimensionality reduction techniques, such as t-SNE, UMAP, PHATE, and Isomap, to visualize and to better understand the molecular networks generated from these metrics. Our results demonstrate the importance of selecting appropriate similarity metrics and their adjustment for particular datasets and usecases. This thesis contributes to the field of untargeted mass spectrometry and metabolomics by investigating the applications of molecular networking to electron ionization gas chromatography-mass spectrometry data.
Klíčová slova:
mass spectra analysis.; metabolomics; Molecular networking; spectral similarity; untargeted mass spectrometry; dimensionality reduction.; mass spectra analysis; mass spectrometry; metabolomics; Molecular networking; spectral similarity
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/209587