National Repository of Grey Literature 6 records found  Search took 0.01 seconds. 
Machine learning models for quantifying phenotypic signatures of cancer cells based on transcriptomic and epigenomic data
Koban, Martin ; PhD, Florian Halbritter, (referee) ; Mehnen, Lars (advisor)
S rozvojom techník pre efektívnu akvizíciu genomických dát sa jednou z kľúčových vedeckých výziev stala interpretácia výsledkov týchto experimentov v zmysluplnom biologickom kontexte. Táto práca sa zameriava na využitie informácií ukrytých v dobre charakterizovaných transkriptomických a epigenomických dátach z verejne dostupných zdrojov pre účely takejto interpretácie. Najskôr je vytvorený integrovaný súbor dát generovaných metódami DNase-seq a ATAC-seq, ktoré kvantifikujú chromatínovú dostupnosť. Tieto údaje sú doplnené verejne dostupnými výsledkami techniky RNA-seq pre kvantitatívne hodnotenie génovej expresie a vhodne predspracované pre ďalšiu analýzu. Pripravené dáta sú následne použité na trénovanie modelov strojového učenia (klasifikátorov) s dvomi základnými cieľmi. Po prvé za účelom augmentácie metadát prislúchajúcich k jednotlivým biologickým vzorkám v trénovacom dátovom súbore pomocou predikcie nedefinovaných anotácií. Po druhé pre anotáciu zle charakterizovaných testovacích dát (nepoužitých v trénovacej fáze) za účelom overenia generalizačnej schopnosti zostavených modelov. Dosiahnuté výsledky ukazujú, že natrénované klasifikátory sú schopné zachytiť biologicky relevantné informácie, zatiaľ čo vplyv technických artefaktov je minimalizovaný. Navrhnutý prístup je preto schopný prispieť k lepšiemu pochopeniu komplexných transkriptomických a epigenomických dát, predovšetkým v oblasti onkologického výskumu.
Unsupervised Deep Learning Approach for Seizure Onset Zone localization in Epilepsy
Přidalová, Tereza ; Cimbálník, Jan (referee) ; Mehnen, Lars (advisor)
Epilepsy affects about 50 million people worldwide, with one-third of patients being drugresistant and therefore candidates for an invasive brain resection surgery. Brain resection surgery candidates undergo invasive intracranial encephalography (iEEG) monitoring to determine the seizure onset zone (SOZ). Recorded data can span over weeks and need to be manually reviewed by a physician to assess SOZ. This process can be time-consuming and burdensome due to the vast amount of collected data. This work investigates utilisation of an deep autoencoder for unsupervised data exploration and specifically its ability to discriminate between SOZ and non-SOZ (NSOZ) iEEG channels. The data used in this thesis consists of iEEG collected from 33 patients in two institutes (Mayo Clinic, Rochester, Minnesota, USA and St. Anne´s University Hospital, Brno, Czech Republic - FNUSA) who underwent invasive presurgical monitoring. The autoencoder’s capability to discriminate between SOZ and NSOZ was evaluated using a self-learned embedded feature space representation of the autoencoder network. Autoencoder features were compared to previously established biomarkers for SOZ determination. Discrimination capability was evaluated for both autoencoder features and biomarkers using a Naive Bayes classifier and leave-one-out cross-validation. The achieved area under receiver operating characteristic curve (AUROC) was 0.68 for the FNUSA and 0.56 for the Mayo dataset. Performance in discriminating between SOZ and NSOZ electrodes was not significantly different between the investigated autoencoder features and previously established biomarkers. Selecting the better performing classifier for each patient increased the AUROC to 0.75 and 0.64 for the FNUSA and Mayo dataset, respectively. The results suggest that future approaches combining biomarkers and self-learning methods have a potential to improve the SOZ vs NSOZ discrimination capability of unsupervised iEEG exploration systems, and thus to enhance the surgical management of epilepsy.
Segmentation of phase contrast images in multi epitope ligand cartography (MELC) for image quantification at the single cell level
Mívalt, Filip ; Taschner-Mandl,, Sabine (referee) ; Mehnen, Lars (advisor)
Technologie Multi-Epitope Ligand Cartography (MELC) umožňuje mikroskopickou vizualizaci více buněčných kompartmentů za pomocí více imunofluorescenčních barviv. Tato pipeline tudíž umožňuje charakterizaci fenotypu pro všechny buňky nacházející se ve vzorcích kostní dřeně u pacientů s neuroblastomem. Přiřazení protilátkového signálu k odpovídající plazmatické membráně jednotlivých buněk je založeno na segmentaci buněčného jádra a algoritmu region growing, jenomže tahle metoda skutečný tvar buňky pouze aproximuje. Tento přístup je mimořádně chybový, pokud je aplikován na překrývající se buňky kvůli nejednoznačnému přiřazení jednoho protilátkového signálu více buňkám. Následně se pak tato chyba dostává až do popisných parametrů charakterizujících každou buňku zvláště, čímž může být ovlivniněna navazující klasifikace nebo kvantifikace buněčného fenotypu. Z toho důvodu je vyžadována segmentace fázově kontrastních obrazů, které jsou pořízeny současně s každým fluorescenčním snímkem, a zobrazují celou buňku (včetně cytoplazmy a jádra). Tato segmentace poskytuje přesné segmentační masky reprezentující celou buňku. Implementovali jsme automatizovanou strategii pro segmentaci těchto fázově kontrastních obrazů využívajíce Mask R-CNN. Algoritmus dosáhl celkového F1 skóre (pro detekci objektů) 0.935 a F1 skóre (pro klasifikaci na úrovni pixelů) 0.868, přičemž byl trénován pouze s malým anotovaným datasetem. Natrénovaný model byl implementován do existující pipeline pro zpracování MELC dat. Kromě toho, poskytujeme anotovaný dataset čítající 54 fázově kontrastních obrazů Cytospin preparátů kostní dřeně obsahující celkově 1 940 buněk. Implementovaný model Mask R-CNN umožňuje studovat popisné parametry charakterizující každou buňku zvláště za použití segmentačních masek odvozených z fázově kontrastních obrazů, které reprezentující celou buňku a tímto tedy zlepšuje automatickou kvantitativní analýzu buněk nacházejících se v kostní dřeni ve výzkumu dětské rakoviny.
Quality assurance of RNA-Seq workflows with spike-ins controls
Drozd, Tomáš ; Turk, Andreas (referee) ; Mehnen, Lars (advisor)
Spike-in controls, jako je External RNA Controls Consortium (ERCC) nebo Spike-In RNA Variants (SIRV) od firmy Lexogen, se staly nezbytnými v odhadování technické variability. Protože SIRV E0 transcripty mají identickou koncentraci, jejich variabilita po sekvenaci lze použít k odvození technické variability z jednotlivých replikovaných vzorků. To je ekonomičtější než standardní přístup, který více replikovaných vzorků pro odhadování technické variability vyžaduje. Model DESeq, což je standardní nástroj pro analýzu rozdílné exprese genu, byl upraven na základě informací ze SIRV nebo ERCC pro odhad variability. Následně se odhadla pravděpodobnost změny na základě technické variability. Vysoká variabilita mezi SIRV transkripty byla zjištěna, což vedlo k jinému přístupu založenému na odhadu variability pro každý transkript samostatně. Tento inovativní přístup odhalil lepší výkon u datasetů, kde byla pro danou analýzu přítomna pouze technická variabilita pro určitý počet replikovaných vzorků pro danou fyziologickou skupinu (například nádorová a zdravá tkáň). Bylo pozorováno, že při zvýšení počtu vzorků vede k vyšší spolehlivosti pro odhad. Spike-ins, zejména SIRV, však zlepšil výkon analýzy než odhadu založeného na endogenních genech pro určitý počet replikovaných vzorků. Pro normalizaci technické variability je nutné provést další výzkum, aby bylo možné odhadnout významné změny v biologické variabilitě při sekvenaci RNA.
Unsupervised Deep Learning Approach for Seizure Onset Zone localization in Epilepsy
Přidalová, Tereza ; Cimbálník, Jan (referee) ; Mehnen, Lars (advisor)
Epilepsy affects about 50 million people worldwide, with one-third of patients being drugresistant and therefore candidates for an invasive brain resection surgery. Brain resection surgery candidates undergo invasive intracranial encephalography (iEEG) monitoring to determine the seizure onset zone (SOZ). Recorded data can span over weeks and need to be manually reviewed by a physician to assess SOZ. This process can be time-consuming and burdensome due to the vast amount of collected data. This work investigates utilisation of an deep autoencoder for unsupervised data exploration and specifically its ability to discriminate between SOZ and non-SOZ (NSOZ) iEEG channels. The data used in this thesis consists of iEEG collected from 33 patients in two institutes (Mayo Clinic, Rochester, Minnesota, USA and St. Anne´s University Hospital, Brno, Czech Republic - FNUSA) who underwent invasive presurgical monitoring. The autoencoder’s capability to discriminate between SOZ and NSOZ was evaluated using a self-learned embedded feature space representation of the autoencoder network. Autoencoder features were compared to previously established biomarkers for SOZ determination. Discrimination capability was evaluated for both autoencoder features and biomarkers using a Naive Bayes classifier and leave-one-out cross-validation. The achieved area under receiver operating characteristic curve (AUROC) was 0.68 for the FNUSA and 0.56 for the Mayo dataset. Performance in discriminating between SOZ and NSOZ electrodes was not significantly different between the investigated autoencoder features and previously established biomarkers. Selecting the better performing classifier for each patient increased the AUROC to 0.75 and 0.64 for the FNUSA and Mayo dataset, respectively. The results suggest that future approaches combining biomarkers and self-learning methods have a potential to improve the SOZ vs NSOZ discrimination capability of unsupervised iEEG exploration systems, and thus to enhance the surgical management of epilepsy.
Machine learning models for quantifying phenotypic signatures of cancer cells based on transcriptomic and epigenomic data
Koban, Martin ; PhD, Florian Halbritter, (referee) ; Mehnen, Lars (advisor)
S rozvojom techník pre efektívnu akvizíciu genomických dát sa jednou z kľúčových vedeckých výziev stala interpretácia výsledkov týchto experimentov v zmysluplnom biologickom kontexte. Táto práca sa zameriava na využitie informácií ukrytých v dobre charakterizovaných transkriptomických a epigenomických dátach z verejne dostupných zdrojov pre účely takejto interpretácie. Najskôr je vytvorený integrovaný súbor dát generovaných metódami DNase-seq a ATAC-seq, ktoré kvantifikujú chromatínovú dostupnosť. Tieto údaje sú doplnené verejne dostupnými výsledkami techniky RNA-seq pre kvantitatívne hodnotenie génovej expresie a vhodne predspracované pre ďalšiu analýzu. Pripravené dáta sú následne použité na trénovanie modelov strojového učenia (klasifikátorov) s dvomi základnými cieľmi. Po prvé za účelom augmentácie metadát prislúchajúcich k jednotlivým biologickým vzorkám v trénovacom dátovom súbore pomocou predikcie nedefinovaných anotácií. Po druhé pre anotáciu zle charakterizovaných testovacích dát (nepoužitých v trénovacej fáze) za účelom overenia generalizačnej schopnosti zostavených modelov. Dosiahnuté výsledky ukazujú, že natrénované klasifikátory sú schopné zachytiť biologicky relevantné informácie, zatiaľ čo vplyv technických artefaktov je minimalizovaný. Navrhnutý prístup je preto schopný prispieť k lepšiemu pochopeniu komplexných transkriptomických a epigenomických dát, predovšetkým v oblasti onkologického výskumu.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.