Original title:
Bioinformatický nástroj pro predikci rozpustnosti proteinů
Translated title:
Bioinformatics Tool for Prediction of Protein Solubility
Authors:
Čermák, Jiří ; Hon, Jiří (referee) ; Martínek, Tomáš (advisor) Document type: Bachelor's theses
Year:
2017
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Abychom dosáhli levnější a efektivnější výroby proteinů, musíme být schopni predikovat, zda budou proteiny rozpustné. V této práci se zabýváme vytvořením bioinformatických datových sad na základě databází Target Track a eSol, testováním příznaků používaných v existujících nástrojích zabývajících se rozpustností proteinů a tvorbou nového prediktoru. Přestože se nám nedaří vytvořit efektivní nástroj na predikci rozpustnosti proteinů, zjišťujeme, že ve většině případů staré příznaky na nové datové sadě nekorelují s rozpustností proteinů tak silně, jako tomu je u starších a menších datových sad.
To achieve cheaper and more efficient protein production, we must be able to predict protein solubility. In this thesis, we describe creation of bioinformatic data sets based on Target Track and eSol databases, we test the features used in existing protein solubility prediction tools and create a new predictor. Even though we fail to create an effective prediction tool we find out that in most cases the old features tested on the new data do not correlate with protein solubility as strongly as others repot in older and smaller datasets.
Keywords:
Machine learning; Protein Aggregation; Protein engineering; Protein solubility; Protein synthesis; Agregace proteinů; Proteinové inženýrství; Rozpustnost proteinů; Strojové učení; Syntéza proteinů
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/69679