Original title:
Techniky klasifikace proteinů
Translated title:
Protein Classification Techniques
Authors:
Dekrét, Lukáš ; Zendulka, Jaroslav (referee) ; Burgetová, Ivana (advisor) Document type: Master’s theses
Year:
2020
Language:
slo Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[slo][eng]
Hlavným cieľom klasifikácie proteínov do rodín je pochopiť štruktúrne, funkčné a evolučné vzťahy medzi jednotlivými proteínmi, ktoré nie sú jednoducho odvoditeľné z dostupných dát. Keďže štruktúra a funkcia proteínov spolu úzko súvisia, zisťovanie funkcie vychádza hlavne zo štruktúrnych vlastností, ktoré sa dajú so súčasnými prostriedkami získať pomerne jednoducho. Klasifikácia proteínov má svoje miesto taktiež pri vývoji špeciálnych liekov, diagnostikovaní klinických chorôb alebo v personalizovanej zdravotnej starostlivosti, vďaka čomu sa do nej investuje značné množstvo zdrojov. V práci som vytvoril nový hierarchický nástroj pre klasifikáciu proteínov, ktorý dosahuje lepšie výsledky ako niektoré existujúce riešenia. Realizácii nástroja predchádzalo oboznámenie s vlastnosťami proteínov, preskúmanie existujúcich prístupov klasifikácie, tvorba rozsiahlej dátovej sady, uskutočnenie experimentov a výber výsledných klasifikátorov hierarchického nástroja.
Main goal of classifying proteins into families is to understand structural, functional and evolutionary relationships between individual proteins, which are not easily deducible from available data. Since the structure and function of proteins are closely related, determination of function is mainly based on structural properties, that can be obtained relatively easily with current resources. Protein classification is also used in development of special medicines, in the diagnosis of clinical diseases or in personalized healthcare, which means a lot of investment in it. I created a new hierarchical tool for protein classification that achieves better results than some existing solutions. The implementation of the tool was preceded by acquaintance with the properties of proteins, examination of existing classification approaches, creation of an extensive data set, realizing experiments and selection of the final classifiers of the hierarchical tool.
Keywords:
amino acid; classification; feature vector; neural net; protein; random forest; SVM
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/192444