Název:
Klasifikace kolejových vozidel
Překlad názvu:
Railway wagons classification
Autoři:
Kotrlý, Michal ; Bilík, Šimon (oponent) ; Honec, Peter (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2023
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Diplomová práce se věnuje klasifikaci kolejových vozidel na základě obrazové informace. V práci jsou teoreticky popsány a následně realizovány dva přístupy ke klasifikaci kolejových vozidel. Prvním přístupem je transformace snímků na histogramy vizuálních slov ze slovníku podle metody Bag of Visual Words a následná aplikace klasických klasifikátorů typu k-NN, SVM, Multinomial Naive Bayes, neuronová síť a Ensemble metoda typu voting classifiers. Druhým přístupem je klasifikace snímků pomocí ověřených architektur konvolučních neuronových sítí využitím metody transfer learning. Sítě AlexNet, VGG16 a ResNet50 byly předtrénovány na obsáhlém datasetu ImageNet a horní vrstvy byly dotrénovány na vlastním datasetu kolejových vozidel. Oba přístupy byly vyladěny pro nejlepší možné výsledky klasifikace. Pro jejich srovnání byl sestaven trénovací dataset s 1773 snímky ve 27 třídách a testovací dataset obsahující 444 snímků. Na testovacím datasetu dosáhl nejúspěšnější klasifikátor s transformací snímků BoVW metodou správnosti 89%. Konvoluční neuronové sítě dosáhly správnosti 95-97%, což je výrazně lepší výsledek. V práci jsou také zohledněny doby predikce nových snímků pro oba přístupy. Nad rámec práce byl implementován algoritmus pro dělení snímků vlakové soupravy na jednotlivé snímky vozů. V závěru jsou uvedeny limitace a popsány důvody omezené robustnosti algoritmu.
This Master's thesis deals with classification of railway wagons based on visual information. A theoretical background of two different approaches for a classification system is provided and both approaches are subsequently implemented. First approach includes transforming images of wagons to histograms of visual words, according to the Bag of Visual Words method. Afterwards, classifiers such as k-NN, SVM, Multinomial Naive Bayes, neural network and Ensemble method, specifically Voting classifiers, are applied. Second approach is classifying images using well known architectures of Convolutional Neural Networks and transfer learning. AlexNet, VGG16 and ResNet50 were pre-trained on a large ImageNet dataset and the upper layers were trained on the dataset of railway wagons. Both approaches were fine-tuned for the best possible performance. For comparison of both approaches a training dataset with 1773 images in 27 classes and testing dataset with 444 images were compiled. On testing dataset the best classifier using BoVW method reached accuracy of 89%. Convolutional neural nets performed with 95-97% accuracy, which is an improvement. Prediction times of images to be classified are also considered. Beyond the scope of the assignment of this thesis, an algorithm for splitting train images into images of individual wagons was developed. In the conclusion, limitations and reasons for limited robustness of this algorithm are presented.
Klíčová slova:
Bag of Visual Words; Klasifikace; Konvoluční neuronové sítě; Odhad přesnosti modelu; Rozpoznávání; Strojové učení; Zpracování obrazu; Bag of Visual Words; Classification; Convolutional Neural Networks; Image Processing; Machine Learning; Model Accuracy Estimation; Recognition
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/209961