Evolutionary Design of Neural Networks
Kastner, Jan ; Hurta, Martin (referee) ; Sekanina, Lukáš (advisor)
The thesis deals with the implementation of a problem-solving method for the automated design of convolutional neural networks (CNN) architectures. The optimization of two fundamental and often conflicting characteristics, the number of parameters and the quality of CNN classification, is performed using a multi-criteria optimization genetic algorithm (NSGA-II). To encode this problem, the Cartesian genetic programming (CGP) technique is used, which enables the wide range of CNN architectures to be represented, and at the same time, the searched area can be appropriately limited by parameterization. Experiments were performed on the MNIST dataset to understand the effect of population size on the quality of the resulting solution. It is also evident from the results of the experiments that the quality of the architectures found can compete with already established models. This is therefore an alternative approach that does not require human intervention compared to manual design.
Movement Planning of a Hexapod Robot
Hostačná, Kristína ; Šátek, Václav (referee) ; Rozman, Jaroslav (advisor)
Táto práca predstavuje riešenie na dosiahnutie autonómnej navigácie šesťnohých robotov k cieľu v zornom poli pomocou neurónových sietí. Toto riešenie bolo implementované na dvoch verziách robotov – jednoduchý dizajn s dvoma kĺbmi na každej nohe a zložitejší dizajn s tromi kĺbmi na každej nohe. Hlavná výzva tohto problému - tj. zložitosť ovládania viacerých kĺbov narástla, aby sa umožnil širší rozsah pohybov a tým aj zväčšenie možností využitia robota. Metodológia výskumu zahŕňa využitie experimentov v simulácii aj v reálnom svete na modelovanie a zber údajov. Údaje z rôznych senzorov, vrátane kamier a pozícií serv, sú využité na trénovanie modelov neurónových sietí schopných interpretovať senzorické vstupy a generovať riadiace signály pre aktuátory robota. Základná architektúra neurónovej siete bola spočiatku nasadená pre obe konfigurácie, zatiaľ čo sofistikovanejší prístup zahŕňajúci konvolučné a rekurentné neurónové siete bol použitý neskôr. Vo výsledku, trénované neurónové siete demonštrujú schopnosť navigácie k cieľu.
Using unlabeled data for retinal segmentation
Shemshur, Andrii ; Jakubíček, Roman (referee) ; Vičar, Tomáš (advisor)
Tato bakalářská práce se zabývá vývojem a hodnocením pokročilých metod pro segmentaci lékařských snímků v kontextu omezených trénovacích dat. Studie zkoumá techniky učení pod dohledem využívající konvoluční neuronové sítě (CNN), přenosové učení s předtrénovanými modely a strategie učení s částečným dohledem. Jako základní model byl použit model konvoluční neuronové sítě (CNN) s dohledem založený na architektuře U-Net, který dosáhl koeficientu Dice 77,6% a průniku nad sjednocením (IoU) 63,4%. Použití přenosového učení pomocí kodéru ResNet34 předtrénovaného na síti ImageNet vedlo k výraznému zlepšení výkonu s koeficientem Dice 81,9%, IoU 69,3% a přesností 96,7%. Kromě toho byly ke zvýšení výkonu modelu použity strategie učení s částečným dohledem, včetně pseudoznačení a předtrénování denoizace. Přístup pseudoznačení přinesl koeficient Dice 81,7% a IoU 69,1%, čímž prokázal účinnost využití neoznačených dat. Přístup před tréninkem denoizace prokázal robustní výkonnost a dosáhl koeficientu Dice 80,3% a IoU 67,0%, a to i v přítomnosti zašuměných a neoznačených dat. Tyto výsledky podtrhují potenciál transferového učení a poloprovozních metod pro zvýšení přesnosti segmentace při analýze lékařských snímků. Poskytují solidní základ pro budoucí výzkum v této oblasti.
Figure trracking
Berka, Jiří Michael ; Řičánek, Dominik (referee) ; Richter, Miloslav (advisor)
This bachelor's thesis focuses on the development of software for tracking an exercising person and evaluating deviations from the correct execution of movement tasks. Initially, the thesis theoretically examines the fundamentals of digital image processing, the use of various types of cameras, and computer vision technologies. Subsequently, methods of artificial intelligence and deep learning that enable motion detection and analysis are described. The main part of the thesis focuses on the implementation of the OpenPose system for real-time pose estimation. Technical challenges are discussed, and solutions are proposed to achieve the accuracy and reliability of the system. The practical part includes testing the software on real videos and evaluating its performance. The results show that the developed software can effectively help in correcting movements and preventing injuries in various applications.
Creating a Python-based Automated System for Recognizing Emotions from Facial Expressions.
Zima, Samuel ; Malik, Aamir Saeed (referee) ; Hussain, Yasir (advisor)
Táto práca skúma rozpoznávanie výrazu tváre (angl. facial expression recognition - FER) pomocou hlbokého učenia so zameraním na použitie v zariadeniach s obmedzenou pamäťou a výpočtovými zdrojmi. Začína výskumom emócií a výrazov tváre z psychologického, biologického a sociologického hľadiska. Jadro výskumu tvorí návrh a implementácia automatizovaného systému pre FER s použitím súboru dát FER-2013. Tento systém využíva prispôsobenú architektúru SqueezeNet rozšírenú o jednoduchý obchvat, vrstvy náhodného odpadu neurónov a vrstvy dávkovej normalizácie. Tento systém dosahuje na súbore dát FER-2013 presnosť 66,37 %. Pre porovnávaciu analýzu sa tento model porovnal s upravenou architektúrou VGG16, ktorá dosiahla presnosť 65,09 %. Táto práca poskytuje cenné poznatky o vývoji menších, efektívnejších modelov strojového učenia pre FER, ktoré sú použiteľné pre široké spektrum zariadení vrátane nízkovýkonných procesorov a vstavaných zariadení.
Automation of video extensometers using artificial intelligence
Leinweber, Vít ; Adamec, Tomáš (referee) ; Ščerba, Bořek (advisor)
This thesis deals with the automation of the use of video extensometers using artificial intelligence methods, specifically the implementation of a suitable algorithm for the recognition of the type of sample to be measured and the placement of a suitable software tool in the correct position on the sample in real-time. The theoretical part of the thesis describes digital image correlation, computer vision with a focus on object recognition, and machine learning with a focus on deep convolutional neural networks and their architectures for object detection. Based on the findings from the theoretical part of the work, the YOLOv8 algorithm is chosen as the most suitable algorithm for classifying the type of sample and determining its location in real-time. In the practical part of the thesis, a dataset containing three types of samples is created using the database of video extensometer manufacturer. The dataset is extended with images containing samples to be detected and augmented. The selected algorithm is trained, optimized, and tested using the created dataset. A genetic algorithm and a random search of the hyperparameter space are used in the optimization process. The best trained models of the YOLOv8 algorithm are compared with each other on two test sets and the best one is selected. Furthermore, the work with this algorithm as a detector integrated into the corresponding software for working with video extensometers is described. Finally, a method for correcting the effect of potential misalignment of samples in the images entering the detector is proposed.
Retinal Images Generation with a Limited Amount of Training Data
Senichak, Yahor ; Semerád, Lukáš (referee) ; Kavetskyi, Andrii (advisor)
The purpose of this study is to explore the progress and application of computer vision and generative adversarial networks (GANs3.1) in the diagnosis and study of fundus diseases. Particular attention is paid to the latest advances in the field of medical data synthesis and the development of our own algorithm. Recent advances in the deep learning architecture U-GAT-IT [22], which includes two pairs of deep neural networks (two generators and two discriminators), have been implemented. This implementation was trained for approximately 300,000 iterations, during which positive results were obtained. The dynamics of the training process were recorded and tests were performed to demonstrate the ability to generate high-quality synthetic images of the ocular background independent of the input data
Deep learning-based noise reduction in X-ray images
Říhová, Barbora ; Jakubíček, Roman (referee) ; Zemek, Marek (advisor)
Technologie zobrazování pomocí rentgenových paprsků je základem zkoumání vnitřní struktury velké škály objektů a výsledky mohou být právě kvůli šumu kompromitovány. Tato práce se zabývá odstraňováním šumu v rentgenových projekcích pomocí hlubokého učení, které má schopnost adaptovat se na konkrétní problém. Práce obsahuje teoretickou rešerši zaměřenou na oblasti produkce a detekce rentgenových paprsků, šumu v rentgenových snímcích a neuronových sítí. Speciální kapitola je věnována popisu vybraného řešení, které je provedeno pomocí tvorby datasetu složeného z části z modelovaných rentgenových projekcí s následně implementovaným šumem odpovídající modelu v reálných snímcích a částečně ze sérií rentgenových projekcí získaných ze zařízení Rigaku nano3DX. K implementaci byla vybrána architektura konvoluční neuronové sítě RIDNet, vzhledem k tomu, že poskytuje v oblasti redukce šumu dobré výsledky. Byly natrénovány tři modely s použitím různých částí datasetu. Nejlepší výkon byl pozorován u modelů, u kterých byla při trénování použita reálná data. Jejich účinnost je srovnatelná s tradičními metodami jako BM3D.
Comparison of Methods for Image Inpainting based on Deep Learning
Rajsigl, Tomáš ; Herout, Adam (referee) ; Španěl, Michal (advisor)
This bachelor thesis aims to compare deep learning methods and approaches for image inpainting using quantitative metrics like PSNR, SSIM, and LPIPS. Moreover, a user study has also been carried out for further subjective assessment. For the purposes of this comparison, four GAN-based neural networks were used. The first network, AOT-GAN, represents a benchmark against which the proposed architecture and its modifications were compared. In the experiments, a variant of the proposed method achieved a 29% improvement against AOT-GAN in images with small missing regions. This claim is also supported by the results of the user study where this method was ranked as the best. As a result of this thesis, a small dataset specifically for the evaluation of image inpainting in the context of object removal was created. Real-world applications of these methods are demonstrated through a web application.
Automated compression of neural network weights
Lorinc, Marián ; Sekanina, Lukáš (referee) ; Mrázek, Vojtěch (advisor)
Konvolučné neurónové siete (CNN) od svojho vynájdenia zrevolucionizovali spôsob, akým sa realizujú úlohy z odvetvia počítačového videnia. Vynález CNN viedol k zníženiu pamäťovej náročnosti, keďže váhy boli nahradené konvolučnými filtrami obsahujúcimi menej trénovateľných váh. Avšak, toto zníženie bolo dosiahnuté na úkor zvýšenia požiadaviek na výpočtový výkon, ktorý je naviazaný na výpočet konvolúcie. Táto práca skúma hypotézu, či je možné sa vyhnúť načítavaniu váh a miesto toho ich vypočítať, čím sa ušetrí energia. Na otestovanie tejto hypotézy bol vyvinutý nový algoritmus kompresie váh využívajúci Kartézske genetické programovanie. Tento algoritmus hľadá najoptimálnejšiu funkciu kompresie váh s cieľom zvýšiť energetickú účinnosť. Experimenty vykonané na architektúrach LeNet-5 a MobileNetV2 ukázali, že algoritmus dokáže efektívne znížiť spotrebu energie pri zachovaní vysokej presnosti modelu. Výsledky ukázali, že určité vrstvy je možné doplniť vypočítanými váhami, čo potvrdzuje potenciál pre energeticky efektívne neurónové siete.

