Název:
Srovnání podobností hmotnostních spekter a struktur malých molekul
Překlad názvu:
Comparison of similarities of mass spectra and structures of small molecules
Autoři:
Malíčková, Viktorie ; Galgonek, Jakub (vedoucí práce) ; Škrhák, Vít (oponent) Typ dokumentu: Bakalářské práce
Rok:
2024
Jazyk:
cze
Abstrakt: [cze][eng] Metody pro měření podobnosti hmotnostních spekter a struktur malých molekul jsou důležité pro pokroky v lékařské chemii, farmakologii a metabolomice. Mezi běžně využívané metody pro porovnání hmotnostních spekter molekul patří kosinová podobnost. Jedná se o míru podobnosti mezi dvěma nenulovými vektory, která měří kosinus úhlu mezi nimi. Porovnání hmotnostních spekter molekul umožňuje vyhledávání v databázích molekul, klastrování spekter a vyhledávání ve spektrálních knihovnách. Strukturní podobnost se pak měří na základě nejrůznějších molekulárních fungerprintů, jako jsou například Daylight fingerprint, RDKit fingerprint, Atom-Pair Fingerprint, Topological Torsion Fingerprint, Extended-Connectivity Fingerprint a další. Tyto fingerprinty jsou pak porovnávány pomocí koeficientů podobnosti. Zmíněné metody pro porovnávání struktur a hmotnostních spekter molekul lze aplikovat pomocí bioinformatických knihoven RDKit a CDK pro generování a analýzu strukturních fingerprintů a knihovny matchms pro porovnání hmotnostních spekter. Práce poskytuje teoretický přehled jak molekulárních deskriptorů, zahrnující rozmanité typy molekulárních fingerprintů a techniky pro měření strukturní podobnosti, tak principu hmotnostní spektrometrie a přístupu k porovnání hmotnostních spekter. Praktická část práce je zaměřena na...Methods for measuring the similarity of mass spectra and the structures of small molecules are crucial for advancements in medicinal chemistry, pharmacology, and metabolomics. One commonly used method for comparing the mass spectra of molecules is cosine similarity. This measures the similarity between two non-zero vectors by calculating the cosine of the angle between them. Comparing the mass spectra of molecules enables searching in molecular databases, clustering of spectra, and exploration of spectral libraries. Structural similarity is measured based on various molecular fingerprints, such as Daylight, RDKit, Atom-Pair, Topological Torsion, Extended-Connectivity fingerprints, and others. These fingerprints are compared using similarity coefficients. The methods for comparing structures and mass spectra of molecules mentioned can be applied using bioinformatic libraries such as RDKit and CDK for generating and analyzing structural fingerprints, and the MatchMS library for comparing mass spectra. The work provides a theoretical overview of molecular descriptors, including various types of molecular fingerprints and techniques for measuring structural similarity, as well as the principles of mass spectrometry and approaches to comparing mass spectra. The practical part of the work focuses on...
Klíčová slova:
bioinformatika; CDK (Chemistry Development Kit); fingerprint; hmotnostní spektrometrie; kosinová podobnost; malé molekuly; MatchMS; MoNA (MassBank of North America); RDKit; Spec2Vec; strukturní podobnost; bioinformatics; CDK (Chemistry Development Kit); cosine similarity; fingerprint; mass spectrometry; MatchMS; MoNA (MassBank of North America); RDKit; small molecules; Spec2Vec; structural similarity