Original title:
Prediction and Analysis of Nucleosome Positions in DNA
Translated title:
Prediction and Analysis of Nucleosome Positions in DNA
Authors:
Višňovský, Marek ; Bendl, Jaroslav (referee) ; Martínek, Tomáš (advisor) Document type: Master’s theses
Year:
2013
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Eukaryotní DNA se váže kolem nukleozomů, čím ovplyvnuje vyšši strukturu DNA a přístup k vazebním mistům pro všeobecní transkripční faktory a oblasti genů. Je proto důležité vědet, kde se nukleozomy vážou na DNA, a jak silná tato vazba je, abychom mohli porozumět mechanizmům regulace genů. V rámci projektu byla implementována nová metoda pro predikci nukleozomů založená na rozšíření Skrytých Markovových modelů, kde jako trénovací a testovací sada posloužila publikována data z Brogaard et al. (Brogaard K, Wang J-P, Widom, J. Nature 486(7404), 496-501 (2012). doi:10.1038/nature11142). Správne predikováno bylo zhruba 50% nukleozomů, co je porovnatenlný výsledek s existujícimi metodami. Okrem toho byla provedena řada experimentů popisující vlastnosti sekvencí nukleozomů a ich organizace.
Genomic DNA in eukaryotes wraps around nucleosomes, which thereby affects higher order DNA structure and access to genomic features like transcription factor binding sites (TFBSs) and gene regions. It is therefore important to have a good understanding of where nucleosomes bind to DNA, and how stable this binding is, in order to understand gene regulation. We developed, implemented and tested a novel approach for genome-wide predictions of nucleosome positions in yeast based on Hidden Markov models extended by duration modeling, using data from Brogaard et al. (Brogaard K, Wang J-P, Widom, J. Nature 486(7404), 496-501 (2012). doi:10.1038/nature11142) for training and testing. Achieved sensitivity closing to 50% does not improve performance compared to other existing methods. In addition, several experiments were conducted on the available dataset to identify features of sequences occupied by nucleosomes and theirs global organization that are important for the prediction performance.
Keywords:
Pozične specifické matice; predikce pozic nukleozomů; Skryté Markovovy modely; Strojové učení; Hidden Markov Models; Machine learning; nucleosome positioning prediction; Positional Weight Matrices
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/187637