Original title:
Diferenciální exprese genů na zakladě negativního binomického modelu
Translated title:
Differential Gene expression using a negative binomial model
Authors:
Janáková, Tereza ; Tkacz, Ewaryst (referee) ; Abo Khayal, Layal (advisor) Document type: Master’s theses
Year:
2014
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[eng][cze]
Hlavním cílem této diplomové práce je analýza diferenciální exprese genů na základě negativního binomického modelu. Úvodní část je věnována teoretickému základu, pojednává o sekvenování RNA, sekvenování nové generace, výhodách a možném využití, formátu fastQ aj. Následující část už se zabývá samotnou praktickou částí, zde byl vybrán vhodný set genů, které budou později analyzovány a příslušná data byla stažena. Tato data byla zarovnána k lidskému genomu verze 37 Burrowsovou-Wheelerovou transformací s využitím bowtie mapovače, byly tak vytvořeny soubory ve formátu SAM. Toto soubory dat byly později setříděny pomocí nástroje SAMtools. Následně byly v programovém prostředí Matlab (verze R2013b) vytvořeny anotované objekty genů s využitím služby Ensembl´s BioMart. Dále byla určena genová exprese a byly odhadnuty faktory velikosti knihovny. Na závěr byly odhadnuty parametry negativního binomického rozložení a byla vyhodnocena diferenciální exprese genů.
The main goal of this master thesis is to carry out the analysis of differential gene expression using a negative binomial model. The first part is devoted to theoretical basis, discusses the RNA sequencing, Next-Generation Sequencing (NGS), the benefits and applications, and FASTAQ format. The second part is the practical part, there was chosen a suitable data set of genes, that will be later analyzed, and the relevant data was downloaded. This data was aligned to the human genome version 37 by Burrows-Wheeler transform and the SAM formatted files were created using the Bowtie mapper. The SAM formatted files were sorted by SAMtools. In the following part of this work was created an annotation object of target genes using Ensembl´s BioMart service and Matlab (version R2013b). Next, digital gene expression was determined and library size factor was estimated. In the end the negative binomial distribution parameters were estimated and data was tested for a differential gene expression.
Keywords:
diferenciální genová exprese; rakovina prostaty; RNA-sekvenování; sekvenování nové generace; Differential gene expression; Next Generation Sequencing; Prostate Cancer; RNA-sequencing
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/31553