National Repository of Grey Literature 282 records found  beginprevious207 - 216nextend  jump to record: Search took 0.01 seconds. 
System for People Detection and Localization Using Thermal Imaging Cameras
Charvát, Michal ; Kempter, Guido (referee) ; Drahanský, Martin (advisor)
V dnešním světě je neustále se zvyšující poptávka po spolehlivých automatizovaných mechanismech pro detekci a lokalizaci osob pro různé účely -- od analýzy pohybu návštěvníků v muzeích přes ovládání chytrých domovů až po hlídání nebezpečných oblastí, jimiž jsou například nástupiště vlakových stanic. Představujeme metodu detekce a lokalizace osob s pomocí nízkonákladových termálních kamer FLIR Lepton 3.5 a malých počítačů Raspberry Pi 3B+. Tento projekt, navazující na předchozí bakalářský projekt "Detekce lidí v místnosti za použití nízkonákladové termální kamery", nově podporuje modelování komplexních scén s polygonálními okraji a více termálními kamerami. V této práci představujeme vylepšenou knihovnu řízení a snímání pro kameru Lepton 3.5, novou techniku detekce lidí používající nejmodernější YOLO (You Only Look Once) detektor objektů v reálném čase, založený na hlubokých neuronových sítích, dále novou automaticky konfigurovatelnou termální jednotku, chráněnou schránkou z 3D tiskárny pro bezpečnou manipulaci, a v neposlední řadě také podrobný návod instalace detekčního systému do nového prostředí a další podpůrné nástroje a vylepšení. Výsledky nového systému demonstrujeme příkladem analýzy pohybu osob v Národním muzeu v Praze.
Visual detection of small objects using available tools in MATLAB
Sladký, Jiří ; Dobossy, Barnabás (referee) ; Appel, Martin (advisor)
This thesis investigates possibilities of small object detection in pictures using YOLO method, a deep learning algorithm available in MATLAB. In the thesis, a detector was designed and trained to detect cows from top-down view. A tool was created, that performs detection using the proposed model even on high resolution images and counts the present objects. A generator of synthetic images was programmed, which helped with training the model. Various experiments were performed that found the limits of YOLO and validated contribution of the proposed improvements.
Object Instance Search in Video
Iakymets, Bohdan ; Zemčík, Pavel (referee) ; Beran, Vítězslav (advisor)
This work focuses on creating mobile application, that helps visitors of galleries and museums to find, in a more easier way, interesting information about visual art objects.
Deep reinforcement learning and snake-like robot locomotion design
Kočí, Jakub ; Dobrovský, Ladislav (referee) ; Matoušek, Radomil (advisor)
This master thesis is discussing application of reinforcement learning in deep learning tasks. In theoretical part, basics about artificial neural networks and reinforcement learning. The thesis describes theoretical model of reinforcement learning process - Markov processes. Some interesting techniques are shown on conventional reinforcement learning algorithms. Some of widely used deep reinforcement learning algorithms are described here as well. Practical part consist of implementing model of robot and it's environment and of the deep reinforcement learning system itself.
Impact of color models on performance of convolutional neural networks
Šimunský, Martin ; Doležel, Petr (referee) ; Škrabánek, Pavel (advisor)
Current knowledge about impact of colour models on performance of convolutional neural network is investigated in the first part of this thesis. The experiment based on obtained knowledge is conducted in the second part. Six colour models HSV, CIE 1931 XYZ, CIE 1976 L*a*b*, YIQ a YCbCr and deep convolutional neural network ResNet-101 are used. RGB colour model achieved the highest classification accuracy, whereas HSV color model has the lowest accuracy in this experiment.
Generating Faces with Conditional Generative Adversarial Networks
Venkrbec, Tomáš ; Hradiš, Michal (referee) ; Kolář, Martin (advisor)
The main goal of this thesis is to implement and compare models based on various architectures of conditional generative adversarial networks. Their main purpose is to conditionally generate realistic looking human faces with selected features. Results from models using DCGAN, WGAN-GP and ProGAN architectures were compared. Models were implemented using Tensorflow library and were trained on Flickr-Faces-HQ dataset. Across all used architectures, I managed to train models capable of generating realistic human faces, with an option to select age and gender.
Generating Faces with Generative Adversarial Networks
Konečný, Daniel ; Herout, Adam (referee) ; Kolář, Martin (advisor)
Cílem této práce je generování barevných obrázků obličejů z náhodně určených vysokodimenzionálních vektorů pomocí generativních neuronových sítí. Dále se zabývá analýzou vstupních vektorů na základě příznaků obličejů z nich vygenerovaných. Je provedena implementace generativní neuronové sítě pro generování obrázků ručně psaných číslic, poté dalších dvou sítí pro generování obrázků obličejů. Vygenerované obrázky zobrazují věrohodně vypadající obličeje, lidské oko je však dokáže odlišit od fotek reálných osob. Analýza jednotlivých dimenzí vektorů je provedena pomocí Studentova t-testu. Dále jsou vstupní vektory promítnuty do podprostorů pomocí lineární diskriminační analýzy a jsou nalezeny rozdělovací hranice mezi třídami příznaků. Analýza generovaných dat dokazuje, že ovlivněním vstupního vektoru je možné docílit generování obrázku obličeje s požadovanými příznaky s pravděpodobností až 80 %. Hlavním výsledkem této práce je model generativní neuronové sítě určené pro generování obrázků obličejů. Dalším přínosem je nástroj pro generování obrázků obličejů na základě vybraných příznaků.
Generation of realistic skydome images
Špaček, Jan ; Wilkie, Alexander (advisor) ; Pilát, Martin (referee)
Generation of realistic skydome images We aim to generate realistic images of the sky with clouds using generative adversarial networks (GANs). We explore two GAN architectures, ProGAN and StyleGAN, and find that StyleGAN produces significantly better results. We also propose a novel architecture SuperGAN which aims to generate images at very high resolutions, which cannot be efficiently handled using state-of-art architectures. 1
Semi-supervised Learning from Unfavorably Distributed Data
Sochor, Matěj ; Pilát, Martin (advisor) ; Mrázová, Iveta (referee)
Semi-supervised learning (SSL) is a branch of machine learning focusing on using not only labeled data samples, but also unlabeled ones, in an effort to decrease the need for labeled data and thus allow using machine learning even when labeling large amounts of data would be too costly. Despite its quick development in the recent years, there are still issues left to be solved before it can be broadly deployed in practice. One of those issues is class distribution mismatch. It arises when the unlabeled data contains samples not belonging to the classes present in the labeled data. This confuses the training and can even lead to getting a classifier performing worse than a classifier trained on the available data in purely supervised fashion. We designed a filtration method called Unfavorable Data Filtering (UDF) which extracts important features from the data and then uses a similarity-based filter to filter the irrelevant data out according to those features. The filtering happens before any of the SSL training takes places, making UDF usable with any SSL algorithm. To judge its effectiveness, we performed many experiments, mainly on the CIFAR-10 dataset. We found out that UDF is capable of significantly improving the resulting accuracy when compared to not filtering the data, identified basic guidelines...
Efficient neural speech synthesis
Vainer, Jan ; Dušek, Ondřej (advisor) ; Hajič, Jan (referee)
While recent neural sequence-to-sequence models have greatly improved the quality of speech synthesis, there has not been a system capable of fast training, fast inference and high-quality audio synthesis at the same time. In this the- sis, we present a neural speech synthesis system capable of high-quality faster- than-real-time spectrogram synthesis, with low requirements on computational resources and fast training time. Our system consists of a teacher and a student network. The teacher model is used to extract alignment between the text to synthesize and the corresponding spectrogram. The student uses the alignments from the teacher model to synthesize mel-scale spectrograms from a phonemic representation of the input text efficiently. Both systems utilize simple convo- lutional layers. We train both systems on the english LJSpeech dataset. The quality of samples synthesized by our model was rated significantly higher than baseline models. Our model can be efficiently trained on a single GPU and can run in real time even on a CPU. 1

National Repository of Grey Literature : 282 records found   beginprevious207 - 216nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.