Národní úložiště šedé literatury Nalezeno 13 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Detekce genomových variací
Beluský, Tomáš ; Vogel, Ivan (oponent) ; Martínek, Tomáš (vedoucí práce)
Vliv variací v lidském genomu je znatelný již při prvním pohledu na člověka, kde se projevují odlišnosti mezi jedinci i celými populacemi. Rovněž chování, nebo pravděpodobnost výskytu určité choroby jsou do značné míry ovlivněny právě změnami na úrovni genomu. Tato práce se zabývá studiem metod detekujících variace v lidském genomu, které byly vyvinuty po nástupu druhé generace sekvenovacích technologií. V rámci této práce byl dále navržen a implementován nový nástroj kombinující metodu read pair a metodu split read s využitím informace o hloubce pokrytí. Nástroj byl otestován na simulačních i reálných datech a porovnán s referenčními výstupy.
Techniky pro zarovnávání skupin biologických sekvencí
Hrazdil, Jiří ; Martínek, Tomáš (oponent) ; Burgetová, Ivana (vedoucí práce)
Práce shrnuje způsoby reprezentace a formáty pro ukládání biologických sekvencí a popisuje databáze, ze kterých lze sekvence získat. V další části pojednává o metodách používaných pro zarovnání dvojice sekvencí. Následuje rozšíření použitých technik na problematiku zarovnání skupiny sekvencí a představení suboptimálních metod realizovatelných v rozumném čase. V praktické části práce je implementována aplikace pro zarovnání skupin sekvencí pomocí popsaných metod v jazyce Java.
Recegnition of Repeating SMS Patterns
Kočalka, Jakub ; Češka, Milan (oponent) ; Holík, Lukáš (vedoucí práce)
With the advances in e-mail spam recognition and user awareness, spammers are moving towards less researched media. One of those is the short messaging system (SMS), which boasts high availability and open rates. Those characteristics are also attractive to legitimate businesses that need to send short, bulk messages to their clients. However, while these messages might be solicited by the end-user, they might represent a loss for the SMS service provider, as these businesses often misuse unlimited SMS plans meant for regular customers to avoid paying for more expensive solutions designated for them. It is therefore desirable to be able to recognize both unsolicited and solicited bulk messages. Bulk messages are generally generated from a template. The goal of this work is to design a clustering algorithm that treats a message as a sequence of lexical units (words), and evaluate it's effectiveness compared to a locality sensitivity hashing method that treats the message as a string of symbols. The work evaluates the suitability of the Smith-Waterman alignment algorithm for this task. The work details why Smith-Waterman (and other local alignment techniques) is unsuitable, and how it can be replaced by Needleman-Wunsch (global alignment) to produce much better results. The resulting algorithm is able to cluster real messages into campaigns satisfactorily, and performs well even in situations where the benchmark locality sensitivity hashing method fragments campaigns.
Vyhodnocení příbuznosti organismů pomocí číslicového zpracování genomických dat
Škutková, Helena ; Tkacz, Ewaryst (oponent) ; Schwarz,, Daniel (oponent) ; Provazník, Ivo (vedoucí práce)
Tato dizertační práce se zabývá alternativními přístupy k analýze genetické informace organismů. V teoretické části práce jsou představeny dva odlišné přístupy vyhodnocení příbuznosti organismů na základě podobnosti jejich genetické informace obsažené v sekvenci DNA. Jedním z nich je dnes standardizovaný postup fylogenetické analýzy znakového zápisu sekvencí DNA. Přestože je tento postup poměrně výpočetně náročný kvůli potřebě mnohonásobného zarovnání DNA sekvencí, umožňuje stanovit podobnost jak globálně celých sekvencí DNA, tak lokalizovat jen konkrétní homologie v nich. Druhým přístupem jsou alternativní techniky klasifikace sekvencí DNA ve formě numerického vektoru reprezentujícího charakteristický rys obsažené genetické informace. Tyto metody označované jako „alignment-free“ umožňují velmi rychlé vyhodnocení globální podobnosti sekvencí DNA, numerickou konverzí však ztrácejí možnost vyhodnotit lokální změny v sekvencích. V praktické části je pak představena nová metoda klasifikace numerických reprezentací DNA kombinující výhody obou uvedených přístupů. Z numerických reprezentací DNA jsou zvoleny jen reprezentace mající 1D signálu podobný charakter, tzn. obsahující specifický trend vyvíjející se podél osy x. Hlavním předpokladem je taxonomická specifičnost těchto genomických signálů. Praktická část práce se zabývá vytvořením vhodných nástrojů pro číslicové zpracování genomických signálů umožňující vyhodnocení vzájemné podobnosti taxonomicky specifických trendů. Na základě vyhodnocené vzájemné podobnosti genomických signálů je provedena klasifikace formou dendrogramu, jež je obdobou fylogenetických stromů využívaných ve standardní fylogenetice.
Effects of hyperparameters in multiple sequence alignment for Align-RUDDER using Clustal
SAMWALD, Christian
Delayed rewards are detrimental to the learning of reinforcement learning agents.One approach to this problem is the usage of return decomposition and rewardredistribution. It was realised in the Align-RUDDER algorithm of Patilet al.[14].Their solution employed the multiple sequence alignment algorithm Clustal W. Iintegrated the sequence alignment Tool Clustal, Clustal W's successor, intoAlign RUDDER to increase efficiency. During the testing process, the usage ofClustal's EPA function and the effects of different sample sizes played a centralrole. The data set that was used came from the MineRL data set [6].
Auto-Encoding Amino Acid Sequences with LSTM
PROMBERGER, Markus
In this thesis a sequence to sequence autoencoder for amino acid sequences is constructed. The latent representation of the autoencoder is then used to classify the amino acid sequences according to their animal kingdom. The data consists of sequences from three different kingdoms, mammals, fish and birds. The thesis includes the preprocessing necessary for the data, the construction of the sequence to sequence autoencoder and the process of classification in the latent space.
Multiple sequence alignment pomocí genetických algoritmů
Pátek, Zdeněk ; Mráz, František (vedoucí práce) ; Pešková, Klára (oponent)
Název práce: Multiple sequence alignment pomocí genetických algoritmů Autor: Zdeněk Pátek Katedra: Kabinet software a výuky informatiky Vedoucí diplomové práce: RNDr. František Mráz, CSc. Abstrakt: Tato práce se zabývá problémem multiple sequence alignment (MSA). Obsahuje návrh metody MSAMS, která umožňuje vyhledat motify v biologických sekvencích, rozštěpit sekvence do bloků podle těchto motifů, vyřešit MSA na blocích a nakonec složit globální alignment ze zarovnaných bloků a nalezených motifů. Hledání motifů i řešení MSA se provádí pomocí genetických algoritmů. Práce dále popisuje implementaci metody MSAMS ve stejnojmenném programu, nastavení jeho parametrů, testování na databázi BAliBASE a porovnání s programem ClustalW. Experimentální výsledky ukázaly, že MSAMS dokáže najít lepší alignmenty než ClustalW. Klíčová slova: multiple sequence alignment, hledání motifů, genetické algoritmy, ClustalW
Recegnition of Repeating SMS Patterns
Kočalka, Jakub ; Češka, Milan (oponent) ; Holík, Lukáš (vedoucí práce)
With the advances in e-mail spam recognition and user awareness, spammers are moving towards less researched media. One of those is the short messaging system (SMS), which boasts high availability and open rates. Those characteristics are also attractive to legitimate businesses that need to send short, bulk messages to their clients. However, while these messages might be solicited by the end-user, they might represent a loss for the SMS service provider, as these businesses often misuse unlimited SMS plans meant for regular customers to avoid paying for more expensive solutions designated for them. It is therefore desirable to be able to recognize both unsolicited and solicited bulk messages. Bulk messages are generally generated from a template. The goal of this work is to design a clustering algorithm that treats a message as a sequence of lexical units (words), and evaluate it's effectiveness compared to a locality sensitivity hashing method that treats the message as a string of symbols. The work evaluates the suitability of the Smith-Waterman alignment algorithm for this task. The work details why Smith-Waterman (and other local alignment techniques) is unsuitable, and how it can be replaced by Needleman-Wunsch (global alignment) to produce much better results. The resulting algorithm is able to cluster real messages into campaigns satisfactorily, and performs well even in situations where the benchmark locality sensitivity hashing method fragments campaigns.
Určování genetické odlišnosti biologických sekvencí DNA
Sliž, Ladislav ; Škutková, Helena (oponent) ; Provazník, Ivo (vedoucí práce)
Práce na téma určování genetické odlišnosti zarovnáváním signálu biologických sekvencí DNA, se bude zabývat stručným popisem skladby DNA. Následovat bude základní informace o bioinformatické analýze. Poté bude práce popisovat možnosti zarovnávání sekvencí DNA. Práce se zaměří především na globální Needlemanův-Wunschův algoritmus a lokální Smit – Watermanovův algoritmus. Dále se tato práce zaměří na zarovnávání DNA sekvencí pomocí metod CGR a FCGR. Na závěr bude práce popisovat praktickou aplikaci určování genetické odlišnosti pomocí zarovnávání sekvencí
Multiple sequence alignment pomocí genetických algoritmů
Pátek, Zdeněk ; Mráz, František (vedoucí práce) ; Pešková, Klára (oponent)
Název práce: Multiple sequence alignment pomocí genetických algoritmů Autor: Zdeněk Pátek Katedra: Kabinet software a výuky informatiky Vedoucí diplomové práce: RNDr. František Mráz, CSc. Abstrakt: Tato práce se zabývá problémem multiple sequence alignment (MSA). Obsahuje návrh metody MSAMS, která umožňuje vyhledat motify v biologických sekvencích, rozštěpit sekvence do bloků podle těchto motifů, vyřešit MSA na blocích a nakonec složit globální alignment ze zarovnaných bloků a nalezených motifů. Hledání motifů i řešení MSA se provádí pomocí genetických algoritmů. Práce dále popisuje implementaci metody MSAMS ve stejnojmenném programu, nastavení jeho parametrů, testování na databázi BAliBASE a porovnání s programem ClustalW. Experimentální výsledky ukázaly, že MSAMS dokáže najít lepší alignmenty než ClustalW. Klíčová slova: multiple sequence alignment, hledání motifů, genetické algoritmy, ClustalW

Národní úložiště šedé literatury : Nalezeno 13 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.