Název:
Quantitative structure-activity relationship a strojové učení
Překlad názvu:
Quantitative structure-activity relationship and machine learning
Autoři:
Nierostek, Jakub ; Uhlík, Filip (vedoucí práce) ; Svozil, Daniel (oponent) Typ dokumentu: Diplomové práce
Rok:
2023
Jazyk:
eng
Abstrakt: [eng][cze] Quantitative structure-activity relationship (QSAR) computational methods allow us to examine the relationship between the chemical structure of molecules and their chemical or biological properties. For QSAR calculations, widely used machine learning methods, such as deep learning models, can be used. In this work, we construct a pipeline for training QSAR machine-learning models that can predict molecular toxicity. Furthermore, we investigate the effect of molecular representation on model performance. Both our deep learning mod- els and traditional machine learning models are employed on Tox21 and Ames Mutagenicity datasets. Their performance is evaluated against recently published models for toxicity prediction using the AUC-ROC metric and, regarding certain toxicity targets, shows improvement over these models. Keywords: QSAR, machine learning, deep learning, molecular descriptors 1Quantitative structure-activity relationship (QSAR) výpočetní metoda nám umožňuje zkoumat vztah mezi chemickou strukturou molekul a jejich chemi- ckými a biologickými vlastnostmi. Pro tvorbu QSAR modelů lze s výhodou použít metody strojového učení, jakými jsou například hluboké neuronové sítě. V této práci jsme vytvořili workflow (pipeline) pro trénování QSAR modelů založených na strojovém učení, které mohou předpovídat toxicitu molekul. Dále zkoumáme vliv molekulární reprezentace na kvalitu předpovědí modelu. Na datasetech Tox21 a Ames Mutagenicity jsou použity jak naše modely hlubokého učení, tak i tradiční modely strojového učení. Jejich kvalita je srovnána s nedávno pub- likovaným modely pro predikci toxicity pomocí metriky AUC-ROC a v určitých ohledech vykazuje zlepšení oproti publikovaným modelům. Klíčová slova: QSAR, strojové učení, hluboké učení, molekulární deskriptory 1
Klíčová slova:
hluboké učení; molekulární deskriptory; QSAR; strojové učení; deep learning; machine learning; molecular descriptors; QSAR