Název:
Techniky pro získávání dat v genomice
Překlad názvu:
Genomic Data Mining Techniques
Autoři:
Jaša, Petr ; Křivka, Zbyněk (oponent) ; Burgetová, Ivana (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2007
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce si v první řadě klade za cíl představit některé běžné techniky pro získávání dat v genomice a v další řadě naimplementovat vlastní algoritmus vycházející z originální verze algoritmu BLAST jako zástupce zmíněných technik. Práce se konkrétně zaměřuje na DNA sekvence, které v sobě uchovávají genetickou informaci, jež je předlohou živých organismů. Pro rozluštění této informace se používá řada technik. Tento text popisuje algoritmus Fasta a algoritmy rodiny BLAST. Pomocí těchto algoritmů je možné získat o sekvencích DNA, u kterých je známá pouze jejich primární struktura, mnoho důležitých informací. Princip algoritmů spočívá v zarovnání jedné vzorové sekvence DNA, ze které chceme získat informace, s mnoha sekvencemi uloženými v databázi. Ze zarovnání je pak možné u vzorové sekvence, na základě míry její podobnosti se sekvencemi databáze, stanovit s určitou pravděpodobností mnoho různých vlastností.
First of all, this thesis sets itself a goal to introduce some common technics for datamining in genomics and as a next step to implement own algorithm like algorithm BLAST. In the concrete, this work is pointed to sequences of DNA. The DNA sequence contains in itself genetic information, which is template for living organism. For explanation this information can be used number of technics. This paper describes algorithm Fasta and algorithms from BLAST family. With these algorithms, it is possible to gain a lot of important information even about such DNA sequences, where only primary structure is known. Principle of these algorithms is based on alignments of one query sequence, which we want to obtain some information from, with many sequences stored in database. According to result alignment, it is possible to determine many features of the query sequence.
Klíčová slova:
adenosin; BLAST; báze; cytosin; DNA; dynamické programování; Fasta; guanin; nukleotid; porovnání; RNA; sekvence DNA; tymin; vyhledávání; zarovnání; adenosine; alignment; base; BLAST; comparison; cytosine; DNA; dynamic programming; Fasta; guanine; nucleotid; RNA; searching; sequence of DNA; thymine
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/187547