Název:
Shlukování proteinových sekvencí na základě podobnosti primární struktury
Překlad názvu:
Clustering of Protein Sequences Based on Primary Structure of Proteins
Autoři:
Jurásek, Petr ; Stryka, Lukáš (oponent) ; Burgetová, Ivana (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2009
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Diplomová práce je zaměřena na shlukování proteinových sekvencí na základě podobnosti primárních struktur. Seznamuje s daty v podobě aminokyselin, které tvoří primární strukturu proteinů. Představuje základní algoritmy pro porovnávání podobnosti proteinových sekvencí. Popisuje shlukovou analýzu a metody shlukování. Praktickou část práce představuje návrh vzdálenostní funkce pro proteiny a implementace metod shlukování AGNES, k-means, k-medoids v jazyce Python.
This master's thesis consider clustering of protein sequences based on primary structure of proteins. Studies the protein sequences from they primary structure. Describes methods for similarities in the amino acid sequences of proteins, cluster analysis and clustering algorithms. This thesis presents concept of distance function based on similarity of protein sequences and implements clustering algorithms ANGES, k-means, k-medoids in Python programming language.
Klíčová slova:
AGNES; aminokyselina; BLOSUM; DNA; dynamické programování; k-means; k-medoids; Molekulární biologie; Needleman-Wunsch algoritmus; PAM; protein; proteinové sekvence; shluková analýza; shlukování; Smith-Waterman algoritmus; substituční matice; AGNES; amino acid; BLOSUM; cluster analysis; clustering; DNA; dynamic programing; k-means; k-medoids; Molecular biology; Needleman-Wunsh algorithm; PAM; primary structure of protein; protein; scoring matrix; Smith-Waterman algorithm
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/53904