Original title:
Shlukování proteinových sekvencí na základě podobnosti primární struktury
Translated title:
Clustering of Protein Sequences Based on Primary Structure of Proteins
Authors:
Jurásek, Petr ; Stryka, Lukáš (referee) ; Burgetová, Ivana (advisor) Document type: Master’s theses
Year:
2009
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Diplomová práce je zaměřena na shlukování proteinových sekvencí na základě podobnosti primárních struktur. Seznamuje s daty v podobě aminokyselin, které tvoří primární strukturu proteinů. Představuje základní algoritmy pro porovnávání podobnosti proteinových sekvencí. Popisuje shlukovou analýzu a metody shlukování. Praktickou část práce představuje návrh vzdálenostní funkce pro proteiny a implementace metod shlukování AGNES, k-means, k-medoids v jazyce Python.
This master's thesis consider clustering of protein sequences based on primary structure of proteins. Studies the protein sequences from they primary structure. Describes methods for similarities in the amino acid sequences of proteins, cluster analysis and clustering algorithms. This thesis presents concept of distance function based on similarity of protein sequences and implements clustering algorithms ANGES, k-means, k-medoids in Python programming language.
Keywords:
AGNES; amino acid; BLOSUM; cluster analysis; clustering; DNA; dynamic programing; k-means; k-medoids; Molecular biology; Needleman-Wunsh algorithm; PAM; primary structure of protein; protein; scoring matrix; Smith-Waterman algorithm; AGNES; aminokyselina; BLOSUM; DNA; dynamické programování; k-means; k-medoids; Molekulární biologie; Needleman-Wunsch algoritmus; PAM; protein; proteinové sekvence; shluková analýza; shlukování; Smith-Waterman algoritmus; substituční matice
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53904