Original title:
Klasifikace obrazů s pomocí hlubokého učení
Translated title:
Image classification using deep learning
Authors:
Hřebíček, Zdeněk ; Přinosil, Jiří (referee) ; Mašek, Jan (advisor) Document type: Master’s theses
Year:
2016
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Práce se zabývá detekcí objektů v obraze a jejich klasifikací do tříd. Klasifikace je zajištěna modely prostředí pro hlubokého učení BVLC/Caffe; Detekci objektů zajišťují algoritmy AlpacaDB/selectivesearch a belltailjp/selective_search_py. Jedním z výsledků této práce je úprava a využití modelu hluboké konvoluční neuronové sítě AlexNet v prostředí BVLC/Caffe. Model byl natrénován s přesností 51,75% pro klasifikaci do 1 000 tříd, následně byl upraven a natrénován pro klasifikaci do 20 tříd s přesnotí 75.50%. Přínosem práce je implementace grafického rozhraní pro detekci a klasifikaci objektů do tříd, jež je implementováno jako aplikace na bázi webového serveru v jazyce Python. Aplikace integruje výše zmíněné algoritmy detekce objektů s klasifikací pomocí BVLC/Caffe. Výslednou aplikaci lze použít jak pro detekci (a klasifikaci) objektů, tak pro rychlé ověření klasifikačních modelů prostředí BVLC/Caffe. Tato aplikace byla pro možnost rozšíření a dlašího využití zveřejněna na serveru GitHub pod licencí Apache 2.0.
This thesis deals with image object detection and its classification into classes. Classification is provided by models of framework for deep learning BVLC/Caffe. Object detection is provided by AlpacaDB/selectivesearch and belltailjp/selective_search_py algorithms. One of results of this thesis is modification and usage of deep convolutional neural network AlexNet in BVLC/Caffe framework. This model was trained with precision 51,75% for classification into 1 000 classes. Then it was modified and trained for classification into 20 classes with precision 75.50%. Contribution of this thesis is implementation of graphical interface for object detction and their classification into classes, which is implemented as aplication based on web server in Python language. Aplication integrates object detection algorithms mentioned abowe with classification with help of BVLC/Caffe. Resulting aplication can be used for both object detection (and classification) and for fast verification of any classification model of BVLC/Caffe. This aplication was published on server GitHub under license Apache 2.0 so it can be further implemented and used.
Keywords:
AlpacaDB/selectivesearch; Artificial inteligence; belltailjp/selective_search_py; BVLC/Caffe; convolution; convolutional networks; deep learning; image classification; machine learning; neural networks; object detection.; AlpacaDB/selectivesearch; belltailjp/selective_search_py; BVLC/Caffe; detekce objektů; hluboké učení; klasifikace obrazů; konvoluce; konvoluční sítě; neuronové sítě; strojové učení; umělá inteligence.
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/59008