National Repository of Grey Literature 531 records found  1 - 10nextend  jump to record: Search took 0.00 seconds. 
Voice-controlled app for capturing photos and clips
Jurčík, Adam Dalibor ; Španěl, Michal (referee) ; Herout, Adam (advisor)
The goal of this work is to create an application that solves the problems of video and photo recording while the same person is playing sports. These problems are, for example, the need to carry a remote control or the constant interruption of the activity due to manual activation. This is solvedby using voice control and keywords to trigger the taking of a photo. This paper discusses in detail how voice control can be implemented on Android operating system in Java programming language. It also includes an explanation of how to store these files and how to control hardware devices such as the camera. The thesis includes a more detailed description of two approaches to voice recognition and describes their functionality in different applications.
Automatic Tire Inspection Using Surface Scans
Toth Vaňo, Pavol ; Materna, Zdeněk (referee) ; Španěl, Michal (advisor)
This thesis deals with automatic detection of defects on tire treads using their depth scans. The approach proposed in the thesis doesn’t require a faultless reference tire for the inspected tire. The first step is the detection of anomalies, which is done using a modification of the PatchCore method proposed in the thesis, taking advantage of the repetition of patterns on the tire tread. Subsequently, anomalies corresponding to special elements on the tire are detected using the deep neural networks Faster R-CNN and Deep Hough transform, and they are filtered out. Applying the proposed approach on the prepared dataset, the value 0.584 of Average Precision metric for detection was obtained. The biggest weakness of the proposed method is its limited ability to detect defects with a very small depth.
Application for Objects Removal from Images Using Deep Learning Methods
Kotoun, Josef ; Hradiš, Michal (referee) ; Španěl, Michal (advisor)
The thesis deals with the development of a web application that allows users to easily select an object in an image and then remove it in a visually plausible way. The application is implemented using the SvelteKit framework. Mobile Segment Anything and Mobile Inpainting GAN neural networks are utilized for object selection and removal. The neural networks are executed on the client-side of the web application using the ONNX Runtime Web library. To efficiently utilize client device resources, WebGPU and WebAssembly technologies are employed. Thanks to the neural networks used, the resulting application enables users to select and remove objects in just a few clicks. According to user feedback, the application is easy to use, and the edited part of the resulting photograph is barely noticeable in most cases.
Deep Neural Networks for Landmark Detection in Images
Stolárik, Samuel ; Španěl, Michal (referee) ; Kubík, Tibor (advisor)
Detekcia významných bodov v medicínskych snímkoch je kľúčová pre diagnostiku rôznych zdravotných ťažkostí. Tento proces je však pracný, časovo náročný a teda drahý. Ako vhodné riešenie sa ukázali hlboké neurónové siete, ktoré umožňujú vytvoriť plne automatické systémy na detekciu týchto bodov. V medicínskej praxi však automatická detekcia naráža na problém nedostatočného množstva trénovacích dát, čo zdôrazňuje potrebu efektívnej reprezentácie dát. V tejto práci sú porovnávané tri rôzne metódy reprezentácie dát počas trénovania hlbokých neurónových sietí. Prvé dve využívajú model U-Net na regresiu teplotných máp a líšia sa v spôsobe ich vytvárania: prvá metóda používa 2D Gaussovské teplotné mapy, ktoré však nezohľadňujú anatomické detaily vo vstupnom obraze, zatiaľ čo druhá metóda tento problém rieši použitím nových „contour-hugging“ teplotných máp priliehajúcich ku kontúram vo vstupnom obraze. Tretia metóda využíva grafovú neurónovú sieť na spracovanie hierarchickej grafovej reprezentácie vstupného obrazu. Experimenty ukázali, že kombinácia modelu U-Net s novými „contour-hugging“ teplotnými mapami umožnila detekovať významné body na kefalometrických snímkoch s priemernou chybou 1,8 mm, čo je zlepšenie o 3,34 % oproti 2D Gaussovským teplotným mapám. Okrem toho, táto metóda predpovedala 70,21 % významných bodov s chybou menšou ako 2 mm.
Comparison of Methods for Image Inpainting based on Deep Learning
Rajsigl, Tomáš ; Herout, Adam (referee) ; Španěl, Michal (advisor)
This bachelor thesis aims to compare deep learning methods and approaches for image inpainting using quantitative metrics like PSNR, SSIM, and LPIPS. Moreover, a user study has also been carried out for further subjective assessment. For the purposes of this comparison, four GAN-based neural networks were used. The first network, AOT-GAN, represents a benchmark against which the proposed architecture and its modifications were compared. In the experiments, a variant of the proposed method achieved a 29% improvement against AOT-GAN in images with small missing regions. This claim is also supported by the results of the user study where this method was ranked as the best. As a result of this thesis, a small dataset specifically for the evaluation of image inpainting in the context of object removal was created. Real-world applications of these methods are demonstrated through a web application.
Stereo Reconstruction with Deep Neural Networks
Letanec, Richard ; Herout, Adam (referee) ; Španěl, Michal (advisor)
The aim of this thesis is to design and train a neural network model capable of estimating a disparity map from a pair of images. It will then be possible to create a depth map and point cloud from the estimated disparity map. Such a process is called stereo reconstruction. Solving this task consists of two steps -- choosing a suitable dataset and choosing a suitable neural network architecture. In my work, I compared two neural network architectures that I trained on the DrivingStereo dataset, consisting of paired images photographed from the roof of a car, and retrained and evaluated on the KITTI 2015 dataset, consisting of images of the same type. As the first neural network architecture, I chose ES-Net, which uses an approach based on a sequence of residual blocks and convolutional layers. As the second architecture, I chose CREStereo, which uses an iterative approach based on recurrent layers to predict the disparity map. In all benchmark tests, the CREStereo architecture achieves better accuracy.
Video Denoising Using Deep Learning
Naumenko, Maksim ; Hradiš, Michal (referee) ; Španěl, Michal (advisor)
V éře digitálních multimédií kvalita videoobsahu významně ovlivňuje uživatelský zážitek a výkon systému, zejména v oblastech, jako je zábava a zpracování videa a obrazu. Tato práce se zabývá přetrvávajícím problémem šumu ve videu, který zhoršuje jeho kvalitu, a to pomocí pokročilých technik hlubokého učení. Nejprve jsou přezkoumány tradiční přístupy k odstraňování šumu ve videu, aby bylo možné nastínit základní koncepty denoisingu. Následně jsou studovány dva referenční modely, FastDVDNet a ViDeNN, za účelem seznámení se s architekturami neuronových sítí. Hlavním výsledkem této práce je vývoj robustního systému pro odstraňování šumu ve videu, který je založen na architektuře UNet inspirované těmito referenčními modely. V průběhu práce jsou vysvětleny, implementovány a vyhodnoceny navrhované modely UNet Baseline, ResUNet a ResUNet Temporal, aby byla prokázána jejich účinnost v odstraňování šumu ve videu.
Deep Learning for 3D Mesh Registration
Pukanec, Dávid ; Beran, Vítězslav (referee) ; Španěl, Michal (advisor)
Zosúhlasovanie 3D modelov je často robené za pomoci registrácie mračien bodov. Úloha registrátie spočíva v nájdení transformácie, ktorá na seba zarovná dané mračná bodov. Existuje mnoho metód založených na hlbokom učení, ktoré sa daju deliť do dvoch kategórií. Tieto metódy zvyčajne poskytujú vyhodnotenie v rámci jednej kategórie a navyše na ro- zličných datasetoch či metrikách. Táto práca sa zaoberá hlbším prieskumom metód Lepard a FINet. Za pomoci datasetov ModelNet40 a Teeth3DS je vykonaná séria experimentov zameriavajúca sa na zložíté prípady registrácie. Experimenty ukázali, že FINet dokáže zarovnať predtým nevidené tvary s translačnou chybou 4.16% veľkosti modelu a rotačnou chybou 3.640 stupňov. Zatiaľ čo Lepard má translačnú chybu 6.73% veľkosti modelu a rotačnú chybu 7.265 stupňov.
Generative Models for 3D Shape Completion
Zdravecký, Peter ; Španěl, Michal (referee) ; Kubík, Tibor (advisor)
Naskenované 3D modely často trpia chybami kvôli oklúzii, skenovacím nedostatkom alebo neúplnosti samotného modelu. Cieľom tejto práce je vyvinúť automatizovaný proces na doplnenie chýbajúcich častí 3D tvarov prostredníctvom hlbokého učenia. Navrhované riešenie vychádza z predchádzajúcej práce DiffComplete, ktorá využíva generatívny difúzny proces na vyplnenie chýbajúcich časti 3D tvarov. Úloha sa takto vníma ako generatívny problém. Výsledky preukazujú vysokú účinnosť tohto modelu s IoU skóre dosahujúcim 81,6 na konkrétnej testovacej sade pozostávajúcej z tvarov nábytku. Model navyše úspešne generalizuje aj na tvary, ktoré nie sú zahrnuté v trénovacej sade, dosahujúc priemerné IoU skóre 70,9. Práca okrem popisu dátovo orientovaných experimentov obohacuje súčasnú problematiku vypĺňania 3D útvarov dvoma spôsobmi. Po prvé rieši najväčšiu limitáciu, výpočetnú náročnosť, spracovaním vstupu v priestore s nízkym rozlíšením. Po druhé využíva užívateľský vstup (vo forme oblasti záujmu), čo umožňuje užívateľovi lepšie ovládať proces generácie v nejednoznačných situáciách.
Deep Learning for Image Stitching
Šilling, Petr ; Beran, Vítězslav (referee) ; Španěl, Michal (advisor)
Sešívání obrázků je klíčovou technikou pro rekonstrukci objemů biologických vzorků z překrývajících se snímků z elektronové mikroskopie (EM). Současné metody zpracování snímků z EM k sešívání zpravidla využívají ručně definované příznaky, produkované například technikou SIFT. Nedávný vývoj však ukazuje, že konvoluční neuronové sítě dokáží zlepšit přesnost sešívání tím, že se naučí diskriminativní příznaky přímo z trénovacích obrázků. S ohledem na potenciál konvolučních neuronových sítí tato práce navrhuje sešívací nástroj DEMIS, který staví na pozornostní síti LoFTR pro hledání shodných příznaků mezi páry obrázků. Dále práce navrhuje novou datovou sadu generovanou dělením obrázků z EM s vysokým rozlišením na pole překrývajících se dlaždic. Výsledná datová sada je použita pro dotrénování sítě LoFTR a k vyhodnocení nástroje DEMIS. Experimenty na dané datové sadě ukazují, že nástroj je schopen nalézt přesnější shody mezi příznaky než SIFT. Navazující experimenty na obrázcích s vysokým rozlišením a malými překryvy mezi dlaždicemi dále poukazují na výrazně vyšší robustnost oproti metodě SIFT. Dosažené výsledky celkově naznačují, že hluboké učení může vést k prospěšným změnám v oblasti EM, například k umožnění menších překryvů mezi snímanými obrázky.

National Repository of Grey Literature : 531 records found   1 - 10nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.