Název:
Predikce rozpustnosti proteinů
Překlad názvu:
Prediction of Protein Solubility
Autoři:
Marušiak, Martin ; Martínek, Tomáš (oponent) ; Hon, Jiří (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2018
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Proteínová rozpustnosť je úzko spojená s použiteľnosťou proteínov pre účely priemyselného využitia a vo výskume. Predikcia rozpustnosti by preto viedla k značnému ušetreniu finančných prostriedkov. V tejto práci je prezentovaný nový prediktor rozpustnosti Solpex založený na strojovom učení, ktorý na nezávislej testovacej sade dosiahol vyššiu presnosť ako porovnateľné existujúce prediktory. Realizácii prediktoru predchádzalo oboznámenie s biologickou podstatou rozpustnosti, preskúmanie existujúcich prístupov k predikcii, tvorba dátových sád, uskutočnenie experimentov a výber vlastností pre prediktor. Najpodstatnejšou z týchto častí je pravdepodobne tvorba dátových sád, ktoré sú kľúčové pre vytvorenie kvalitného prediktoru. V súvislosti s dátovými sadami je v tejto práci podrobne popísané spracovanie hlavného zdroja ich dát - databázy TargetTrack.
Protein solubility is closely related to the usability of proteins in industrial use and research. The successful prediction of solubility would therefore lead to a significant saving of financial resources. This work presents new solubility predictor Solpex based on machine learning that achieved better performance on independent test set than any comparable solubility prediction tool. The predictor implementation was preceded by a study of the biological nature of solubility, evaluation of existing solubility prediction approaches, datasets building, many experiments with novel features and selection of the best features for the predictor. As the most important step in machine learning is the datasets building, this work mainly benefits from own rigorous processing of the main source of solubility data - the TargetTrack database.
Klíčová slova:
predikcia; proteín; rozpustnosť; Solpex; strojové učenie; TargetTrack; machine learning; prediction; protein; Solpex; solubility; TargetTrack
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/85135