Original title:
Bioinformatická analýza dat hmotnostní spektrometrie v metabolomice
Translated title:
Bioinformatic analysis of mass spectrometry data in metabolomics
Authors:
Skoryk, Maksym ; Raček,, Tomáš (referee) ; Mgr. Aleš Křenek, Ph.D (advisor) Document type: Master’s theses
Year:
2023
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta chemická Abstract:
[eng][cze]
Náplní této diplomové práce je zkoumání a porovnání metod pro analýzu dat hmotnostní spektrometrie se zaměřením na konstruování a interpretace molekulárních sítí. Primárním cílem tohoto výzkumu je identifikace vhodných metrik shodnosti hmotnostních spekter pro vytváření molekulárních sítí, které by odhalily smysluplné vztahy mezi sloučeninami a jejich strukturními a biologickými vlastnostmi. Pro dosažení stanoveného cíle důkladně jsme prozkoumáli výkonnost různých metrik podobností hmotnostních spekter, včetně kosinové podobnosti, spektrální entropie, Spec2Vec a také Spec2Vec a MS2DeepScore založených na metodách strojového učení. Následně jsme použili techniky redukce rozměrů, jako je t-SNE, UMAP, PHATE a Isomap, abychom vizualizovali a lépe porozuměli molekulárním sítím generovaným z těchto metrik. Získané výsledky demonstrují důležitost výběru vhodných metrik podobností a jejich úpravy pro konkrétní datové sady. Tato práce přispívá k oblasti necílené hmotnostní spektrometrie a metabolomiky zkoumáním aplikací molekulárních sítí na datech elektronově-ionizační plynové chromatografií-hmotnostní spektrometrie.
This Master's thesis explores and compares methods for the analysis of mass spectrometry data, focusing on the construction and application of molecular networks. The primary objective of this study is to identify suitable mass spectra similarity metrics for the construction of molecular networks, which would reveal meaningful relationships between compounds and their structural and biological properties. To achieve this goal, we thoroughly investigated the performance of different mass spectra similarity metrics, including cosine similarity, spectral entropy, as well as machine learning-based Spec2Vec, and MS2DeepScore. We then applied dimensionality reduction techniques, such as t-SNE, UMAP, PHATE, and Isomap, to visualize and to better understand the molecular networks generated from these metrics. Our results demonstrate the importance of selecting appropriate similarity metrics and their adjustment for particular datasets and usecases. This thesis contributes to the field of untargeted mass spectrometry and metabolomics by investigating the applications of molecular networking to electron ionization gas chromatography-mass spectrometry data.
Keywords:
dimensionality reduction.; mass spectra analysis; mass spectrometry; metabolomics; Molecular networking; spectral similarity; mass spectra analysis.; metabolomics; Molecular networking; spectral similarity; untargeted mass spectrometry
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/209587