National Repository of Grey Literature 21 records found  1 - 10nextend  jump to record: Search took 0.02 seconds. 
Segmentation of multiple sclerosis lesions using deep neural networks
Sasko, Dominik ; Myška, Vojtěch (referee) ; Kolařík, Martin (advisor)
Hlavným zámerom tejto diplomovej práce bola automatická segmentácia lézií sklerózy multiplex na snímkoch MRI. V rámci práce boli otestované najnovšie metódy segmentácie s využitím hlbokých neurónových sietí a porovnané prístupy inicializácie váh sietí pomocou preneseného učenia (transfer learning) a samoriadeného učenia (self-supervised learning). Samotný problém automatickej segmentácie lézií sklerózy multiplex je veľmi náročný, a to primárne kvôli vysokej nevyváženosti datasetu (skeny mozgov zvyčajne obsahujú len malé množstvo poškodeného tkaniva). Ďalšou výzvou je manuálna anotácia týchto lézií, nakoľko dvaja rozdielni doktori môžu označiť iné časti mozgu ako poškodené a hodnota Dice Coefficient týchto anotácií je približne 0,86. Možnosť zjednodušenia procesu anotovania lézií automatizáciou by mohlo zlepšiť výpočet množstva lézií, čo by mohlo viesť k zlepšeniu diagnostiky individuálnych pacientov. Našim cieľom bolo navrhnutie dvoch techník využívajúcich transfer learning na predtrénovanie váh, ktoré by neskôr mohli zlepšiť výsledky terajších segmentačných modelov. Teoretická časť opisuje rozdelenie umelej inteligencie, strojového učenia a hlbokých neurónových sietí a ich využitie pri segmentácii obrazu. Následne je popísaná skleróza multiplex, jej typy, symptómy, diagnostika a liečba. Praktická časť začína predspracovaním dát. Najprv boli skeny mozgu upravené na rovnaké rozlíšenie s rovnakou veľkosťou voxelu. Dôvodom tejto úpravy bolo využitie troch odlišných datasetov, v ktorých boli skeny vytvárané rozličnými prístrojmi od rôznych výrobcov. Jeden dataset taktiež obsahoval lebku, a tak bolo nutné jej odstránenie pomocou nástroju FSL pre ponechanie samotného mozgu pacienta. Využívali sme 3D skeny (FLAIR, T1 a T2 modality), ktoré boli postupne rozdelené na individuálne 2D rezy a použité na vstup neurónovej siete s enkodér-dekodér architektúrou. Dataset na trénovanie obsahoval 6720 rezov s rozlíšením 192 x 192 pixelov (po odstránení rezov, ktorých maska neobsahovala žiadnu hodnotu). Využitá loss funkcia bola Combo loss (kombinácia Dice Loss s upravenou Cross-Entropy). Prvá metóda sa zameriavala na využitie predtrénovaných váh z ImageNet datasetu na enkodér U-Net architektúry so zamknutými váhami enkodéra, resp. bez zamknutia a následného porovnania s náhodnou inicializáciou váh. V tomto prípade sme použili len FLAIR modalitu. Transfer learning dokázalo zvýšiť sledovanú metriku z hodnoty približne 0,4 na 0,6. Rozdiel medzi zamknutými a nezamknutými váhami enkodéru sa pohyboval okolo 0,02. Druhá navrhnutá technika používala self-supervised kontext enkodér s Generative Adversarial Networks (GAN) na predtrénovanie váh. Táto sieť využívala všetky tri spomenuté modality aj s prázdnymi rezmi masiek (spolu 23040 obrázkov). Úlohou GAN siete bolo dotvoriť sken mozgu, ktorý bol prekrytý čiernou maskou v tvare šachovnice. Takto naučené váhy boli následne načítané do enkodéru na aplikáciu na náš segmentačný problém. Tento experiment nevykazoval lepšie výsledky, s hodnotou DSC 0,29 a 0,09 (nezamknuté a zamknuté váhy enkodéru). Prudké zníženie metriky mohlo byť spôsobené použitím predtrénovaných váh na vzdialených problémoch (segmentácia a self-supervised kontext enkodér), ako aj zložitosť úlohy kvôli nevyváženému datasetu.
Learning the Face Behind a Voice
Zubalík, Petr ; Mošner, Ladislav (referee) ; Plchot, Oldřich (advisor)
The main goal of this thesis is to design and implement a system that will be able to generate a face based on the speech of a given person. This problem is solved using a system composed of three convolutional neural network models. The first one is based on the ResNet architecture and is used to extract features from speech recordings. The second model is a fully convolutional neural network which converts the extracted features into the styles which form a base for the final facial image. These styles are then passed as an input to the StyleGAN generator, which creates the resulting face. The proposed system is implemented in the Python programming language using the PyTorch framework. The last chapter of the thesis discusses some of the most significant experiments performed to fine-tune and test the developed system.
Material Artefact Generation
Rončka, Martin ; Španěl, Michal (referee) ; Kodym, Oldřich (advisor)
Ne vždy je jednoduché získání dostatečně velké a kvalitní datové sady s obrázky zřetelných artefaktů, ať už kvůli nedostatku ze strany zdroje dat nebo složitosti tvorby anotací. To platí například pro radiologii, nebo také strojírenství. Abychom mohli využít moderní uznávané metody strojového učení které se využívají pro klasifikaci, segmentaci a detekci defektů, je potřeba aby byla datová sada dostatečně velká a vyvážená. Pro malé datové sady čelíme problémům jako je přeučení a slabost dat, které způsobují nesprávnou klasifikaci na úkor málo reprezentovaných tříd. Tato práce se zabývá prozkoumáváním využití generativních sítí pro rozšíření a vyvážení datové sady o nové vygenerované obrázky. Za použití sítí typu Conditional Generative Adversarial Networks (CGAN) a heuristického generátoru anotací jsme schopni generovat velké množství nových snímků součástek s defekty. Pro experimenty s generováním byla použita datová sada závitů. Dále byly použity dvě další datové sady keramiky a snímků z MRI (BraTS). Nad těmito dvěma datovými sadami je provedeno zhodnocení vlivu generovaných dat na učení a zhodnocení přínosu pro zlepšení klasifikace a segmentace.
Speech Enhancement with Cycle-Consistent Neural Networks
Karlík, Pavol ; Černocký, Jan (referee) ; Žmolíková, Kateřina (advisor)
Hlboké neurónové siete sa bežne používajú v oblasti odstraňovania šumu. Trénovací proces neurónovej siete je možné rožšíriť využitím druhej neurónovej siete, ktorej cieľom je vložiť šum do čistej rečovej nahrávky. Tieto dve siete sa môžu spolu využiť k rekonštrukcii pôvodných čistých a zašumených nahrávok. Táto práca skúma efektivitu tejto techniky, zvanej cyklická konzistencia. Cyklická konzistencia zlepšuje robustnosť neurónovej siete bez toho, aby sa daná sieť akokoľvek modifikovala, nakoľko vystavuje sieť na odstraňovanie šumu rôznorodejšiemu množstvu zašumených dát. Avšak, táto technika vyžaduje trénovacie dáta skladajúce sa z párov vstupných a referenčných nahrávok. Tieto dáta niesu vždy dostupné. Na trénovanie modelov s nepárovanými dátami využívame generatívne neurónové siete s cyklickou konzistenciou. V tejto práci sme vykonali veľké množstvo experimentov s modelmi trénovanými na párovaných a nepárovaných dátach. Naše výsledky ukazujú, že využitie cyklickej konzistencie výrazne zlepšuje výkonnosť modelov.
Generative Adversarial Networks Applied for Privacy Preservation in Bio-Metric-Based Authentication and Identification
Mjachky, Ľuboš ; Malinka, Kamil (referee) ; Homoliak, Ivan (advisor)
Systémy založené na biometrickej autentizácii sa stávajú súčasťou nášho každodenného bytia. Tieto systémy však nedovoľujú používateľom priamo alebo nepriamo meniť spôsob, akým sa k ich dátam pristupuje a ako sa s nimi bude zaobchádzať ďalej v budúcnosti. Dôsledkom tohto môžu vyplynúť riziká spojené s uniknutím identity jedinca. Táto práca sa zaoberá návrhom systému, ktorý zachováva privátnosť a zároveň umožňuje autentizáciu na základe biometrických čŕt používateľov, a to za pomoci generatívnej neurónovej siete (GAN). V práci sa konkrétne uvažuje o tom, že GAN je použitá na transformáciu obrázkov tvárí napríklad na obrázky kvetov. Autentizačný systém sídliaci na serveri je v konečnom dôsledku učený rozlišovať používateľov podľa obrázkov kvetov a nie tvárí. Na základe vykonaných experimentov môžeme potvrdiť, že navrhovaná metóda je robustná voči útokom, pričom stále vykazuje kvalitatívne požiadavky kladené na štandardný autentizačný systém.
Reconstruction of Facial Images Using Neural Networks
Zubalík, Petr ; Drahanský, Martin (referee) ; Goldmann, Tomáš (advisor)
The main purpose of this bachelor's thesis is to propose and implement a model, using neural networks, that will be able to reconstruct low-resolution facial images with blurry parts of the face. The task of super-resolution of facial images is solved by two models based on convolutional neural networks. The first model is built upon the architecture of ResNet whereas the other model makes use of the principles of generative adversarial networks. The proposed models are implemented in the Python programming language with the use of application programming interface of the TensorFlow framework. Moreover, as a part of this work, an application with a simple grafical user interface was created. This application makes it easy to use the implemented models. Several experiments are analyzed in the last chapter of this thesis to evaluate the performance of the models.
Generative Adversial Network for Artificial ECG Generation
Šagát, Martin ; Ronzhina, Marina (referee) ; Hejč, Jakub (advisor)
The work deals with the generation of ECG signals using generative adversarial networks (GAN). It examines in detail the basics of artificial neural networks and the principles of their operation. It theoretically describes the use and operation and the most common types of failures of generative adversarial networks. In this work, a general procedure of signal preprocessing suitable for GAN training was derived, which was used to compile a database. In this work, a total of 3 different GAN models were designed and implemented. The results of the models were visually displayed and analyzed in detail. Finally, the work comments on the achieved results and suggests further research direction of methods dealing with the generation of ECG signals.
Machine learning based method for medical image generation
Hrtoňová, Valentina ; Chmelík, Jiří (referee) ; Jakubíček, Roman (advisor)
This thesis deals with the use of generative adversarial networks for the synthesis of medical images. Firstly, artificial neural networks are described with a focus on convolutional neural networks and generative adversarial networks. Applications of generative adversarial networks in medicine are reviewed, and selected publications on the topic of medical image synthesis are described in more detail. Furthermore, multiple models of generative adversarial networks are designed and implemented in the Python programming language. First is a model of the deep convolutional generative adversarial network and the model „pix2pix“ for the generation of skin lesion images. Moreover, the „pix2pix“ model is used for the generation of both axial and sagittal CT images of the spine. Finally, the results of generating medical images using generative adversarial networks are presented and discussed.
Reconstruction and Enhancement of Damaged Parts of Fingerprint Images
Špila, Andrej ; Rydlo, Štěpán (referee) ; Heidari, Mona (advisor)
Táto práca sa zaoberá problémom rekonštrukcie snímkov odtlačkov prsta so zameraním na neobnovyteľné oblasti poškodené rôznymi kožnými ochoreniami. Generatívne súperi- ace siete s trénovateľnou konvolučnou vrstvou s gaborovými filtrami bola natrénovaná na dátovej sade reálnych snímkov odtlačkov prsta. Práca predvádza že natrénovaný model vie spoľahlivo rekonštruovať malé oblasti ľubovoľného tvaru a v prípade väčších oblastí, globálne skóre kvality rekonštruovaného odtlačku prsta získané využitím softvéru NIST biometric image software sa v porovnaní s originálnym snímkom navýšilo. Je navrhnutý štandardizovaný formát pre snímky odtlačkov prsta ktorý pomohol stabilizovat trénovanie generatívnych súperiacich sietí.
Generative Adversarial Networks and Applications in Bioinformatics
KOLESNICHENKO, Nikita
Generative Adversarial Networks (GAN) are currently considered a state-of-the-art method for image generation. Recently, Deep Convolutional Generative Adversarial Networks (DCGAN) yielded promising results in protein contact maps generation. The algorithm generated realistic protein structures, which were less erroneous than previously used generative methods. However, DCGAN is notorious for being hard to train due to the limitations of its loss function and complications in optimization. Wasserstein Generative Adversarial Networks (WGAN) was proposed, employing the Wasserstein loss function that stabilizes training and alleviates some of the DCGAN's training problems. In this thesis, a hyperparameter grid search for DCGAN and WGAN was conducted on the CIFAR-10 dataset. Runs with different hyperparameters were compared using Fréchet Inception Distance to determine whether WGAN is more stable than DCGAN.

National Repository of Grey Literature : 21 records found   1 - 10nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.