Národní úložiště šedé literatury Nalezeno 5 záznamů.  Hledání trvalo 0.00 vteřin. 
Platform for Biological Sequence Analysis Using Machine Learning
Lacko, Dávid ; Burgetová, Ivana (oponent) ; Martínek, Tomáš (vedoucí práce)
Machine learning has many active areas and one of them is protein characterisation since experimental annotation is usually costly and time-consuming, and many datasets suitable for training predictors are currently being published. One of the recent methods, called innov'SAR, combines the Fourier transform with partial linear regression and has been used in several protein engineering applications. However, the code for the method is not freely available and the method itself was not statistically verified. The goal of this thesis is to address these limitations, implement and extend the method using Python language in an easy-to-use platform that allows training and testing of the models. The extensions include parallelization, Spearman scoring function and aligned sequence input. The statistical significance testing is also performed to verify the impact of the found dependencies between input sequences and properties of the proteins. The method proved to be statistically significant with strong dependencies found between inputs and outputs. Two newly collected halalkane dehalogenase datasets were used to train models and they have cross validation scores of Q2 = 0.54 and Q2 = 0.77 with almost double the improvement over the baseline models. Created models allow filtering of large sequence databases and scanning for potential improvements in the protein properties.
Databázový systém pro správu biologických dat
Drlík, Radovan ; Burgetová, Ivana (oponent) ; Jaša, Petr (vedoucí práce)
Práce se zabývá problematikou uchovávání a správy biologických dat, především enzymů halogenalkan dehalogenáz. Dále se zaměřuje na projekt HADES (HAloalkane DEhalogenase databaSe) iniciovaný proteinovými inženýry Loschmidtových laboratoří Masarykovy univerzity v Brně. Jedná se o projekt, jehož hlavním cílem je jednoduše ukládat, uchovávat a zobrazovat různorodá data o proteinech. Výsledkem práce je flexibilní databázový systém umožňující snadnou rozšiřitelnost a udržovatelnost, který je postavený na technologiích Apache, PostgreSQL a PHP s využitím Zend Frameworku.
Strukturní studie halogenalkandehalogenasy DgaA z \kur{Glaciecola agarilytica} NO2
BERKOVÁ, Ivana
Halogenalkandehalogenenásy (HLDs) jsou mikrobiální enzymy, které se staly významnou skupinou intenzivního zkoumání v rámci životního prostředí. HLDs jsou schopny ireverzibilní hydrolýzy širokého spektra halogenovaných sloučenin. Mohou být použity při průmyslové katalýze a bioremediaci znečišťujících látek životního prostředí. Protein DgaA byl prvně objeven v mořském sedimentu ve východní části Korei, který patří do nadrodiny a / hydroláz, izolovaná z psychrofilního a mírně halofilního organismu, Glaciecola agarilytica NO2. Hlavním cílem této práce bylo zpracování difrakčních dat z krystalů DgaA proteinů a následné řešení a zpřesnění struktury studovaného proteinu.
Platform for Biological Sequence Analysis Using Machine Learning
Lacko, Dávid ; Burgetová, Ivana (oponent) ; Martínek, Tomáš (vedoucí práce)
Machine learning has many active areas and one of them is protein characterisation since experimental annotation is usually costly and time-consuming, and many datasets suitable for training predictors are currently being published. One of the recent methods, called innov'SAR, combines the Fourier transform with partial linear regression and has been used in several protein engineering applications. However, the code for the method is not freely available and the method itself was not statistically verified. The goal of this thesis is to address these limitations, implement and extend the method using Python language in an easy-to-use platform that allows training and testing of the models. The extensions include parallelization, Spearman scoring function and aligned sequence input. The statistical significance testing is also performed to verify the impact of the found dependencies between input sequences and properties of the proteins. The method proved to be statistically significant with strong dependencies found between inputs and outputs. Two newly collected halalkane dehalogenase datasets were used to train models and they have cross validation scores of Q2 = 0.54 and Q2 = 0.77 with almost double the improvement over the baseline models. Created models allow filtering of large sequence databases and scanning for potential improvements in the protein properties.
Databázový systém pro správu biologických dat
Drlík, Radovan ; Burgetová, Ivana (oponent) ; Jaša, Petr (vedoucí práce)
Práce se zabývá problematikou uchovávání a správy biologických dat, především enzymů halogenalkan dehalogenáz. Dále se zaměřuje na projekt HADES (HAloalkane DEhalogenase databaSe) iniciovaný proteinovými inženýry Loschmidtových laboratoří Masarykovy univerzity v Brně. Jedná se o projekt, jehož hlavním cílem je jednoduše ukládat, uchovávat a zobrazovat různorodá data o proteinech. Výsledkem práce je flexibilní databázový systém umožňující snadnou rozšiřitelnost a udržovatelnost, který je postavený na technologiích Apache, PostgreSQL a PHP s využitím Zend Frameworku.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.