Název:
Segmentace obrazu s využitím hlubokého učení
Překlad názvu:
Image segmentation using deeplearning methods
Autoři:
Lukačovič, Martin ; Burget, Radim (oponent) ; Mašek, Jan (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2017
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [slo][eng]
Práca sa zaoberá súčasnými metódami segmentácie obrazu s~využitím hlbokého učenia. Opísané sú taktiež ostatné prístupy s uplatnením neurónových sietí v~oblasti hlbokého učenia. Obsahuje historické riešenia neurónových sietí, ich vývoj a základný princíp. Konvolučné neurónové siete majú v~súčasnosti najväčšie využitie pri riešení úloh ako je detekcia, klasifikácia a segmentácia obrazu. Pre overenie funkčnosti bolo v~práci použité voľne dostupné prostredie na princípe podmienených náhodných polí ako rekurentných neurónových sietí a jeho porovnanie s využitím hlbokých konvolučných neurónových sietí s dodatočnou aplikáciou podmienených náhodných polí. Posledná zmienená metóda sa stala základom pre trénovanie vlastného modelu na dvoch rôznych datasetoch. Za účelom implementácie neurónových sietí s~využitím hlbokého učenia existujú rôzne prostredia, ktoré ponúkajú rozmanité možnosti prevedenia. Pre demošntračné účely bolo v práci navrhnuté webové rozhranie v jazyku Python a pre realizáciu segmentácie bolo zvolené prostredie BVLC\,/\,Caffe. Najlepšia dosiahnutá presnosť vlastného trénovaného modelu pre segmentáciu oblečenia je 50,74\,\% a pre segmentáciu VOC objektov je to 68,52\,\%. Webové rozhranie sa uplatňuje ako nástroj pre jednoduchú interakciu užívateľa s cieľom segmentácie obrazu trénovanými modelmi.
This thesis deals with the current methods of semantic segmentation using deep learning. Other approaches of neaural networks in the area of deep learning are also discussed. It contains historical solutions of neural networks, their development, and basic principle. Convolutional neural networks are nowadays the most preferable networks in solving tasks as detection, classification, and image segmentation. The functionality was verified on a freely available environment based on conditional random fields as recurrent neural networks and compered with the deep convolutional neural networks using conditional random fields as postprocess. The latter mentioned method has become the basis for training of new models on two different datasets. There are various enviroments used to implement neural networks using deep learning, which offer diverse perform possibilities. For demonstration purposes a Python application leveraging the BVLC\,/\,Caffe framework was created. The best achieved accuracy of a trained model for clothing segmentation is 50,74\,\% and 68,52\,\% for segmentation of VOC objects. The application aims to allow interaction with image segmentation based on trained models.
Klíčová slova:
/\; BVLC\; Caffe; clothing segmentation; CNN; conditional random fields; deep learning; image segmentation; neural networks
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/65794