Original title:
Sémantická segmentace obrazu pomocí konvolučních neuronových sítí
Translated title:
Semantic segmentation of images using convolutional neural networks
Authors:
Špila, Filip ; Věchet, Stanislav (referee) ; Krejsa, Jiří (advisor) Document type: Master’s theses
Year:
2020
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta strojního inženýrství Abstract:
[eng][cze]
Tato práce se zabývá rešerší a implementací vybraných architektur konvolučních neuronových sítí pro segmentaci obrazu. V první části jsou shrnuty základní pojmy z teorie neuronových sítí. Tato část také představuje silné stránky konvolučních sítí v oblasti rozpoznávání obrazových dat. Teoretická část je uzavřena rešerší zaměřenou na konkrétní architekturu používanou na segmentaci scén. Implementace této architektury a jejích variant v Caffe je převzata a upravena pro konkrétní použití v praktické části práce. Nedílnou součástí tohoto procesu jsou kroky potřebné ke správnému nastavení softwarového a hardwarového prostředí. Příslušná kapitola proto poskytuje přesný návod, který ocení zejména noví uživatelé Linuxu. Pro trénování všech variant vybrané sítě je vytvořen vlastní dataset obsahující 2600 obrázků. Je také provedeno několik nastavení původní implementace, zvláště pro účely použití předtrénovaných parametrů. Trénování zahrnuje výběr hyperparametrů, jakými jsou například typ optimalizačního algoritmu a rychlost učení. Na závěr je provedeno vyhodnocení výkonu a výpočtové náročnosti všech natrénovaných sítí na testovacím datasetu.
This thesis deals with the research and implementation of selected architectures of Convolutional Neural Networks (CNNs) for image segmentation. The fundamental terms from the theory of neural networks are summarized in the first part. It also presents the power of CNNs in the field of image data classification. The theoretical part concludes with the research focused on the particular network architecture and its variants used for scene segmentation. In the practical part, the Caffe implementation of the network is taken from its authors and tailored to the specific needs of this study. The steps required to properly set up the software and hardware environments are an essential part of the process. Therefore, the corresponding chapter gives a step-by-step guide that is especially helpful to new Linux users. A custom dataset containing 2600 segmented images is created and used for training all variants of the selected network. Several adjustments of the original implementation are performed, especially for applying the method of using pre-trained parameters of the networks. The training phase includes a selection of hyperparameters, such as the type of optimization algorithm. Finally, the performance and computational cost of the variants of the trained network are evaluated on a testing dataset.
Keywords:
Caffe; konvoluční neuronové sítě; SegNet; sémantická segmentace; Ubuntu; Caffe; convolutional neural networks; SegNet; semantic segmentation; Ubuntu
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/192992