Národní úložiště šedé literatury Nalezeno 12 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
High-performance exploration and querying of selected multi-dimensional spaces in life sciences
Kratochvíl, Miroslav ; Bednárek, David (vedoucí práce) ; Glaab, Enrico (oponent) ; Svozil, Daniel (oponent)
Tato práce studuje, implementuje a experimentuje se specifickými, aplikačně orien- tovanými přístupy pro prozkoumávání a dotazování multimediálních dat. První část práce zkoumá indexování komplexního prostoru chemických sloučenin a popisuje návrh vysoce výkonného systému pro dotazování v databázích malých molekul. Výsledný sys- tém je následně využit v širším kontextu federovaného vyhledávání v heterogenních dat- ech a metadatech souvisejících s chemickými informačními zdroji. V druhé části se práce zaměřuje na rychlou vizualizaci a prohledávání mnohadimenziálních dat pocháze- jících z jednobuněčné průtokové cytometrie. Ze samoorganizačních map odvozuje rychlé metody pro analýzu dat, a využívá je jako základ pro nový vizualizační algoritmus. Podobný přístup zpracování dat je nakonec využit pro vysoce interaktivní prohledávání multimediálních dat. Hlavní příspěvky a výsledky práce se sestávají z pokroku v opti- malizaci metod pro dotazování chemických dat implementovaných v databázi Sachem, federovaného rozhraní pro Sachem založeného na jazyce SPARQL které poskytuje pod- poru pro heterogenního dotazování, algoritmu EmbedSOM pro redukci dimenzionality, návrhu a implementace specifických analytických nástrojů pro průtokovou a hmotnos- tní cytometrii odvozených od algoritmu EmbedSOM, a návrhu a implementace...
Quantitative structure-activity relationship and machine learning
Nierostek, Jakub ; Uhlík, Filip (vedoucí práce) ; Svozil, Daniel (oponent)
Quantitative structure-activity relationship (QSAR) výpočetní metoda nám umožňuje zkoumat vztah mezi chemickou strukturou molekul a jejich chemi- ckými a biologickými vlastnostmi. Pro tvorbu QSAR modelů lze s výhodou použít metody strojového učení, jakými jsou například hluboké neuronové sítě. V této práci jsme vytvořili workflow (pipeline) pro trénování QSAR modelů založených na strojovém učení, které mohou předpovídat toxicitu molekul. Dále zkoumáme vliv molekulární reprezentace na kvalitu předpovědí modelu. Na datasetech Tox21 a Ames Mutagenicity jsou použity jak naše modely hlubokého učení, tak i tradiční modely strojového učení. Jejich kvalita je srovnána s nedávno pub- likovaným modely pro predikci toxicity pomocí metriky AUC-ROC a v určitých ohledech vykazuje zlepšení oproti publikovaným modelům. Klíčová slova: QSAR, strojové učení, hluboké učení, molekulární deskriptory 1
Similarity Search in Protein Databases
Hoksza, David ; Skopal, Tomáš (vedoucí práce) ; Navarro, Gonzalo (oponent) ; Svozil, Daniel (oponent)
Jedna z hlavních operací v oblasti bioinformatiky je prirazení podobnosti proteinových sekvencí a struktur. Toto prirazení se využívá v širokém spektru aplikací jako je predikce proteinové struktury, prirazení funkce, automatická klasifikace, atd. Proteinové databáze zaznamenaly v posledních letech exponenciální rust dat, címž se stávající metody pro extrakci podobnosti stávají nevhodnými vzhledem k objemu dat. V této práci se zabýváme podobnostním vyhledáváním na úrovni proteinové sekvence a struktury. Na obou úrovních navrhujeme vylepšení stávajících metod, stejne jako nové metody pro práci s proteiny z hlediska podobnosti. V první cásti se zabýváme podobnostním vyhledáváním na úrovni proteinové sekvence. Nejdríve zkoumáme možnosti aplikace metrických prístupových metod pro efektivní uložení a vyhledávání sekvencí. Poté se zamerujeme na podobnostní míru proteinových sekvencí jako takovou. Výpocet podobnosti proteinových sekvencí je založen na dynamickém programování a proto navrhujeme vylepšení za úcelem zrychlení vyhledávání znovuvyužíváním cástí matice dynamického programování pri zachování presnosti vyhledávání. Druhá cást práce se zabývá podobností proteinových struktur. Predstavujeme nový prístup k reprezentaci proteinových struktur, který je invariantní s ohledem na posun a rotaci. Invariance...
Similarity search in Mass Spectra Databases
Novák, Jiří ; Skopal, Tomáš (vedoucí práce) ; Svozil, Daniel (oponent) ; Nahnsen, Sven (oponent)
Tandemová hmotnostní spektrometrie je známá metoda pro identifikaci proteinových a peptidových sekvencí ze vzorků biologického materiálu. Hmotnostní spektrometr generuje desetitisíce spekter, která musí být následně anotována peptidovými sekvencemi. Za tímto účelem lze využít podobnostní vyhledávání v databázích teoretických spekter generovaných z databází známých proteinových sekvencí. Vzhledem k tomu, že objem těchto databází každoročně narůstá téměř exponenciálním tempem, je zapotřebí hledat nové způsoby pro jejich indexování. V této práci se zaměřujeme na využití (ne)metrických přístupových metod jako databázových indexů pro rychlé a aproximativní podobnostní vyhledávání v databázích spekter. Navržená metoda identifikace peptidových sekvencí dosahuje více než 100-násobného zrychlení oproti sekvenčnímu průchodu celé databáze, přičemž je správně anotováno přes 90% spekter. V současnosti je metoda vhodná zejména pro malé směsi proteinů. Pro komplexní směsi proteinů využíváme indexovací metodu založenou na prekurzorovém hmotnostním filtru, která má při použití s modifikací parametrizované Hausdorffovy vzdálenosti vyšší rychlost i přesnost vyhledávání než běžně používané metody. Navržené metody jsou implementovány v aplikaci SimTandem, kterou lze použít pro dávkové zpracování ve frameworku TOPP...
Similarity Search in Protein Structure Databases
Galgonek, Jakub ; Skopal, Tomáš (vedoucí práce) ; Porto, Markus (oponent) ; Svozil, Daniel (oponent)
Proteiny patří mezi nejdůležitějších biopolymery, nebot' v organismu zastáva- jí nejrůznější životně důležité funkce. Jejich funkční rozmanitost je umožněna především jejich velkou strukturní rozmanitostí. Navíc se ukazuje, že proteiny sdílející podobnou strukturu sdílí také jiné vlastnosti (např. funkci, evoluční původ, atd.). Proto je studiu proteinových struktur a možnosti identifikovat podobné struktury věnována taková pozornost. V této práci představujeme systém umožňující podobnostní vyhledávání v databázích proteinových struktur. Tento systém, pro danou dotazovou struk- turu, vyhledá v databáze ty struktury, které jsou dotazu strukturně podobné. Systém se skládá z několika klíčových částí. Byla navržena vlastní podob- nostní míra umožňující měřit podobnost mezi dvojicí proteinových struk- tur. Speciálně pro tuto míru byla vytvořena přístupová metoda založená na metrické přístupové metodě LAESA. Přístupová metoda umožňuje hle- dat podobné struktury mnohem rychleji, než by to bylo možné sekvenčním procházením databáze. Pro dosažení dalšího urychlení byly obě části parale- lizovány, přičemž se podařilo dosáhnout téměř lineárního zrychlení. Poslední částí je...
High-performance exploration and querying of selected multi-dimensional spaces in life sciences
Kratochvíl, Miroslav ; Bednárek, David (vedoucí práce) ; Glaab, Enrico (oponent) ; Svozil, Daniel (oponent)
Tato práce studuje, implementuje a experimentuje se specifickými, aplikačně orien- tovanými přístupy pro prozkoumávání a dotazování multimediálních dat. První část práce zkoumá indexování komplexního prostoru chemických sloučenin a popisuje návrh vysoce výkonného systému pro dotazování v databázích malých molekul. Výsledný sys- tém je následně využit v širším kontextu federovaného vyhledávání v heterogenních dat- ech a metadatech souvisejících s chemickými informačními zdroji. V druhé části se práce zaměřuje na rychlou vizualizaci a prohledávání mnohadimenziálních dat pocháze- jících z jednobuněčné průtokové cytometrie. Ze samoorganizačních map odvozuje rychlé metody pro analýzu dat, a využívá je jako základ pro nový vizualizační algoritmus. Podobný přístup zpracování dat je nakonec využit pro vysoce interaktivní prohledávání multimediálních dat. Hlavní příspěvky a výsledky práce se sestávají z pokroku v opti- malizaci metod pro dotazování chemických dat implementovaných v databázi Sachem, federovaného rozhraní pro Sachem založeného na jazyce SPARQL které poskytuje pod- poru pro heterogenního dotazování, algoritmu EmbedSOM pro redukci dimenzionality, návrhu a implementace specifických analytických nástrojů pro průtokovou a hmotnos- tní cytometrii odvozených od algoritmu EmbedSOM, a návrhu a implementace...
Computational study of short peptides and miniproteins in different environments
Vymětal, Jiří ; Vondrášek, Jiří (vedoucí práce) ; Svozil, Daniel (oponent) ; Berka, Karel (oponent)
Peptidy, kromě své biologické funkce, představují take důležité modely nesbalených, de- naturovaných nebo nestrukturovaných proteinů. Pobobně důležitými modely pro exper- imentální i teoretické studium sbalování proteinů jsou miniproteiny, jako např. Trp- cage. Chování peptidů i proteinů lze studovat v počítačových simulacích pomocí metod molekulární dynamiky, které umožnují sledovat děje v atomistickém rozlišení. Tyto metody však čelí však dvěma zásadním problémům - přesnosti používaných energetick- ých funkcí a nedostatečnému vzorkování konformačních stavů. V této disertaci jsem se zabýval oběma okruhy problémů. Vliv rozdílných, běžně používných energetických funkcí ("force fields") byl testován na modelu aminokyselinových dipeptidů. Žádná sada parametrů však nedokázala konzis- tentně reprodukovat konformační preference jednotlivých aminokyselin. Výsledky simu- lací byly mezi sebou srovnány a byly hledány příčiny jejich vzájemných odlišností. Abychom odhalili, jakým způsobem různé podmínky ovlivňují konformační stavy peptidů, zkoumali jsme vlastnosti aminokyselin v AAXAA peptidech. Simulace odhalily zásadní rozdíl ve vlivu tepelné a chemické denaturace (močovinou) na charakter a zastoupení konformací peptidů, stejně jako konformačních preferencí jednotlivých aminokyselin. K problematice vzorkování...
Similarity search in Mass Spectra Databases
Novák, Jiří ; Skopal, Tomáš (vedoucí práce) ; Svozil, Daniel (oponent) ; Nahnsen, Sven (oponent)
Tandemová hmotnostní spektrometrie je známá metoda pro identifikaci proteinových a peptidových sekvencí ze vzorků biologického materiálu. Hmotnostní spektrometr generuje desetitisíce spekter, která musí být následně anotována peptidovými sekvencemi. Za tímto účelem lze využít podobnostní vyhledávání v databázích teoretických spekter generovaných z databází známých proteinových sekvencí. Vzhledem k tomu, že objem těchto databází každoročně narůstá téměř exponenciálním tempem, je zapotřebí hledat nové způsoby pro jejich indexování. V této práci se zaměřujeme na využití (ne)metrických přístupových metod jako databázových indexů pro rychlé a aproximativní podobnostní vyhledávání v databázích spekter. Navržená metoda identifikace peptidových sekvencí dosahuje více než 100-násobného zrychlení oproti sekvenčnímu průchodu celé databáze, přičemž je správně anotováno přes 90% spekter. V současnosti je metoda vhodná zejména pro malé směsi proteinů. Pro komplexní směsi proteinů využíváme indexovací metodu založenou na prekurzorovém hmotnostním filtru, která má při použití s modifikací parametrizované Hausdorffovy vzdálenosti vyšší rychlost i přesnost vyhledávání než běžně používané metody. Navržené metody jsou implementovány v aplikaci SimTandem, kterou lze použít pro dávkové zpracování ve frameworku TOPP...

Národní úložiště šedé literatury : Nalezeno 12 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.