Original title:
Techniky pro získávání dat v genomice
Translated title:
Genomic Data Mining Techniques
Authors:
Jaša, Petr ; Křivka, Zbyněk (referee) ; Burgetová, Ivana (advisor) Document type: Master’s theses
Year:
2007
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce si v první řadě klade za cíl představit některé běžné techniky pro získávání dat v genomice a v další řadě naimplementovat vlastní algoritmus vycházející z originální verze algoritmu BLAST jako zástupce zmíněných technik. Práce se konkrétně zaměřuje na DNA sekvence, které v sobě uchovávají genetickou informaci, jež je předlohou živých organismů. Pro rozluštění této informace se používá řada technik. Tento text popisuje algoritmus Fasta a algoritmy rodiny BLAST. Pomocí těchto algoritmů je možné získat o sekvencích DNA, u kterých je známá pouze jejich primární struktura, mnoho důležitých informací. Princip algoritmů spočívá v zarovnání jedné vzorové sekvence DNA, ze které chceme získat informace, s mnoha sekvencemi uloženými v databázi. Ze zarovnání je pak možné u vzorové sekvence, na základě míry její podobnosti se sekvencemi databáze, stanovit s určitou pravděpodobností mnoho různých vlastností.
First of all, this thesis sets itself a goal to introduce some common technics for datamining in genomics and as a next step to implement own algorithm like algorithm BLAST. In the concrete, this work is pointed to sequences of DNA. The DNA sequence contains in itself genetic information, which is template for living organism. For explanation this information can be used number of technics. This paper describes algorithm Fasta and algorithms from BLAST family. With these algorithms, it is possible to gain a lot of important information even about such DNA sequences, where only primary structure is known. Principle of these algorithms is based on alignments of one query sequence, which we want to obtain some information from, with many sequences stored in database. According to result alignment, it is possible to determine many features of the query sequence.
Keywords:
adenosine; alignment; base; BLAST; comparison; cytosine; DNA; dynamic programming; Fasta; guanine; nucleotid; RNA; searching; sequence of DNA; thymine; adenosin; BLAST; báze; cytosin; DNA; dynamické programování; Fasta; guanin; nukleotid; porovnání; RNA; sekvence DNA; tymin; vyhledávání; zarovnání
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/187547