Národní úložiště šedé literatury Nalezeno 2 záznamů.  Hledání trvalo 0.01 vteřin. 
Enzyme optimization using sequence homology and machine learning
Neitzert, Gesa-Maret ; Příhoda, David (vedoucí práce) ; Hoksza, David (oponent)
Ve farmaceutickém výzkumu a vývoji hrají enzymy důležitou roli při syntéze léků a molekul souvisejících s léky. Pro vyšší účinnost a zvýšenou produkci je důležité optimalizovat výtěžek těchto enzymů, což je úkol často řešený proteinovým inženýrstvím a designem. Tento proces optimalizace enzymu se však může stát zdlouhavým s obrovskými možnostmi mutací pro každý jednotlivý protein. Ke zlepšení procesu optimalizace enzymů lze použít sekvenční homologii a metody strojového učení. Ty výrazně snižují manuální úsilí při přepracování proteinů a mohou pomoci při hledání nejvhodnějšího enzymu pro daný úkol, čímž se zvyšuje efektivita celého procesu vývoje léčiv. S ohledem na tento cíl tato práce shrnuje výběr existujících metod a jejich možné aplikace při optimalizaci enzymů. Testování dvou prediktivních modelů s různou složitostí na 4 souborech dat ve snaze optimalizovat absorpci, enantioselektivitu, nebo teplotní stabilitu zjistilo pouze mírnou korelaci mezi skutečnými cílovými hodnotami a jejich předpokládanými hodnotami: průměr Pearsonova R 0,20775 a 0,5188. Porovnání pravděpodobnostních vzorů vložení proteinových sekvencí vedlo ke korelačnímu skóre 0,815 se substituční maticí BLOSUM62, což potvrzuje intuici jazykového modelu o přirozené frekvenci různých typů mutací. Zatímco výsledky prediktivních...
Ambiguous representation of genetic variants in the VCF format
Neitzert, Gesa-Maret ; Daněček, Petr (vedoucí práce) ; Fišer, Karel (oponent)
Variant call format (VCF) je formát souborů používaný k reprezentaci a ukládání informací o variantách. Genetické varianty ve VCF mohou být reprezentovány více způsobů, protože specifikace VCF umožňuje nejednoznačnost, která může nastat kvůli různým variant call pipelinům nebo rozdílům v alignmentech sekvencí. Nejednoznačnosti narušují srovnávání souborů ve VCF a jejich variant, což vede ke komplikacím při další analýze variant. Tato práce zkoumá rozdíly v reprezentaci genetických variant, které se mohou vyskytnout, a také jejich pravděpodobné příčiny a dopady na další analýzu. Dále je zkoumána normalizace souborů VCF a je uveden algoritmus pro atomizaci a deatomizaci souborů VCF. Klíčová slova: VCF, variant call format, ambivalentní reprezentace variant, srovnání variantů, atomizace variantů, deatomizace variantů

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.