Název:
Techniky klasifikace proteinů
Překlad názvu:
Protein Classification Techniques
Autoři:
Dekrét, Lukáš ; Zendulka, Jaroslav (oponent) ; Burgetová, Ivana (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [slo][eng]
Hlavným cieľom klasifikácie proteínov do rodín je pochopiť štruktúrne, funkčné a evolučné vzťahy medzi jednotlivými proteínmi, ktoré nie sú jednoducho odvoditeľné z dostupných dát. Keďže štruktúra a funkcia proteínov spolu úzko súvisia, zisťovanie funkcie vychádza hlavne zo štruktúrnych vlastností, ktoré sa dajú so súčasnými prostriedkami získať pomerne jednoducho. Klasifikácia proteínov má svoje miesto taktiež pri vývoji špeciálnych liekov, diagnostikovaní klinických chorôb alebo v personalizovanej zdravotnej starostlivosti, vďaka čomu sa do nej investuje značné množstvo zdrojov. V práci som vytvoril nový hierarchický nástroj pre klasifikáciu proteínov, ktorý dosahuje lepšie výsledky ako niektoré existujúce riešenia. Realizácii nástroja predchádzalo oboznámenie s vlastnosťami proteínov, preskúmanie existujúcich prístupov klasifikácie, tvorba rozsiahlej dátovej sady, uskutočnenie experimentov a výber výsledných klasifikátorov hierarchického nástroja.
Main goal of classifying proteins into families is to understand structural, functional and evolutionary relationships between individual proteins, which are not easily deducible from available data. Since the structure and function of proteins are closely related, determination of function is mainly based on structural properties, that can be obtained relatively easily with current resources. Protein classification is also used in development of special medicines, in the diagnosis of clinical diseases or in personalized healthcare, which means a lot of investment in it. I created a new hierarchical tool for protein classification that achieves better results than some existing solutions. The implementation of the tool was preceded by acquaintance with the properties of proteins, examination of existing classification approaches, creation of an extensive data set, realizing experiments and selection of the final classifiers of the hierarchical tool.
Klíčová slova:
amino acid; classification; feature vector; neural net; protein; random forest; SVM
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/192444