Název:
Bioinformatický nástroj pro predikci rozpustnosti proteinů
Překlad názvu:
Bioinformatics Tool for Prediction of Protein Solubility
Autoři:
Hronský, Patrik ; Burgetová, Ivana (oponent) ; Martínek, Tomáš (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2016
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Táto diplomová práca sa zaoberá rozpustnosťou rekombinantných proteínov a hlavne jej predikciou. Približuje čitateľovi problematiku vzniku proteínov, ako aj proces tvorby rekombinantných proteínov. Syntetická výroba rekombinantných proteínov je významným prínosom napríklad pre farmakologický priemysel. Ide však o náročný proces, ktorý navyše nemusí priniesť použiteľné proteíny. Podstatným ukazateľom použiteľnosti výsledných proteínov je práve ich rozpustnosť. Pre spoločnosti, zaoberajúce sa výrobou rekombinantných proteínov, je samozrejme výhodné sústrediť svoje úsilie a prostriedky na výrobu tých proteínov, ktoré budú v praxi použiteľné. V tomto ohľade podáva pomocnú ruku bioinformatika, ktorá je pomocou techník strojového učenia schopná predikovať rozpustnosť proteínov, napríklad na základe ich sekvencie. Táto práca zoznamuje čiteteľa so základnými princípmi strojového učenia a predstavuje niektoré metódy strojového učenia, používané okrem iného aj na predikciu rozpustnosti proteínov. Práca ďalej opisuje vytvorenú dátovú sadu, ktorá je neskôr použitá na testovanie vybraných prediktorov a pre trénovanie konsenzuálneho prediktoru, ktorý je cieľom práce. Ďalej sa práca zameriava na konkrétne existujúce prediktory rozpustnosti proteínov a prezentuje základné princípy ich funkčnosti, ako aj výsledky ich testovania. V závere prezentuje konsenzuálny metaprediktor rozpustnosti proteínov.
This master's thesis addresses the solubility of recombinant proteins and its prediction. It describes the subject of protein synthesis, as well as the process of recombinant protein creation. Recombinant protein synthesis is of great importance for example to pharmacologic industry. This synthesis is not a simple task and it does not always produce viable proteins. Protein solubility is an important factor, determining the viability of the resulting proteins. It is of course favourable for companies, that take part in recombinant protein synthesis, to focus their effort and their resources on proteins, that will be viable in the end. In this regard, bioinformatics is of great help, as it is capable, with the help of machine learning, of predicting the solubility of proteins, for example based on their sequences. This thesis introduces the reader to the basic principles of machine learning and presents several machine learning methods, used in the field of protein solubility prediction. It deals with the definition of a dataset, which is later used to test selected predictors, as well as to train the ensemble predictor, which is the main focus of this thesis. It also focuses on several specific protein solubility predictors and explains the basic principles upon which they are built, as well as the results of their testing. In the end, it presents the ensemble predictor of protein solubility.
Klíčová slova:
klasifikácia; konsenzuálna metóda; predikcia; proteín; rekombinantný; rozpustnosť; strojové učenie; classification; ensemble method; machine learning; prediction; protein; recombinant; solubility
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/61855