Original title:
Klasifikace obrazů planktonu s proměnlivou velikosti pomocí konvoluční neuronové sítě
Translated title:
Classification of Varying-Size Plankton Images with Convolutional Neural Network
Authors:
Bureš, Jaroslav ; Juránek, Roman (referee) ; Zemčík, Pavel (advisor) Document type: Master’s theses
Year:
2020
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Tato práce pojednává o technikách automatické analýzy obrazu založené na konvolučních neuronových sítích (CNN), zaměřených na klasifikaci planktonu. V oblasti studování planktonu panuje velká diverzita v jeho tvarech a velikostech. Kvůli tomuto bývá klasifikace pomocí CNN náročná, jelikož CNN typicky požadují definovanou velikost vstupu. Běžné metody využívají škálování obrazu do jednotné velikosti. Avšak kvůli tomuto jsou ztraceny drobné detaily potřebné ke správné klasifikaci. Cílem práce bylo navrhnout a implementovat CNN klasifikátor obrazových dat planktonu a prozkoumat metody, které jsou zaměřené na problematiku různorodých velikostí obrázků. Metody, jako jsou patch cropping, využití spatial pyramid pooling vrstvy, zahrnutí metadat a sestavení multi-stream modelu jsou vyhodnoceny na náročném datasetu obrázků fytoplanktonu. Takto bylo dosaženo zlepšení o 1.0 bodů pro InceptionV3 architekturu s výslednou úspěšností 96.2 %. Hlavním přínosem této práce je vylepšení CNN klasifikátorů planktonu díky úspěšné aplikaci těchto metod.
This work considers techniques of automatic image analysis based on convolutional neural networks (CNN) focused on plankton classification. There is a large variation in the shapes and sizes of plankton images. This makes the classification for CNN based methods challenging since CNNs typically require a fixed input size. Naive methods utilize scaling of the images to a common size. However, this operation leads to the loss of small details that are necessary for correct classification. The aim of this work was to design and implement a CNN-based classifier of plankton images and explore possible methods that can deal with a variety of image sizes. Multiple methods such as patch cropping, utilization of a spatial pyramid pooling layer, inclusion of metadata and construction of multi-stream model were evaluated on a challenging dataset of phytoplankton images. With these methods an improvement of 1.0 point was achieved for the InceptionV3 architecture resulting in an accuracy of 96.2 %. The main contribution of this thesis is an improvement of multiple CNN plankton classifiers by successfully applying these methods.
Keywords:
klasifikace; konvoluční neuronové sítě; Plankton; počítačové vidění; rozmanitá velikost obrazu; strojové učení; zpracování obrazu; classification; computer vision; convolutional neural network; image processing; machine learning; Plankton; varying image size
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/192511