Název:
Počítání přepravek v obrazech
Překlad názvu:
Counting Crates in Images
Autoři:
Mičulek, Petr ; Špaňhel, Jakub (oponent) ; Herout, Adam (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2021
Jazyk:
eng
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [eng][cze]
V této práci se zabývám tématem počítání beden v obrazových datech pomocí technik hlubokého učení. V práci jsem navrhl řešení pro počítání beden, které představuji na fotkách krabiček sirek. Ačkoli původní řešení počítalo s využitím datové sady beden ze skladu pivovaru, sada nakonec nebyla dodána a na doporučení vedoucího práce byly pro řešení vybrány bloky krabiček sirek. Implementované řešení využívá plně konvoluční neuronovou síť založenou na klasifikaci, umožňující výstup ve vysokém rozlišení. Tato síť je trénována na výřezech fotek z datové sady, díky čemuž je řešení rychlé a síť je vhodná i pro použití na menších datových sadách. Síť detekuje ve fotkách klíčové body krabiček sirek, které jsou následně zpracovány algoritmem pro odhad klíčových bodů z predikce sítě a výpočet finálního počtu beden. Na validačním datasetu dosahuje řešení následujících výsledků: ve 12,5 % případů predikce selže a ve zbylých případech má průměrnou absolutní odchylku (MAE) 11,14. Pomocí rozsáhlých experimentů bylo řešení vyhodnoceno a výsledky potvrzují, že tento přístup může být použit pro počítání objektů.
This thesis deals with the topic of using deep learning to count crates in images. I have designed a crate-counting solution for blocks of matchboxes, using a fully convolutional classification-based network with a high resolution output. The original project proposition counted on using a dataset of photos of crates from a beer brewery warehouse. I did not get access to the dataset in the end. On the recommendation of my supervisor, I based the crate-counting solution on a custom dataset of matchbox photos. The CNN is trained using image patches, leading to a fast solution working even on smaller datasets. Matchbox keypoints are detected by the CNN in the input images and they are processed by a keypoint estimation and crate-counting algorithm to produce the final crate count. On validation data, the solution has a 12.5% failure rate and a MAE of 11.14. Thorough experimentation was performed to evaluate the solution and the results verify that this approach can be used for object counting.
Klíčová slova:
Convolutional Neural Networks; Image Processing; Keypoint Detection; Object Counting; detekce klíčových bodů; konvoluční neuronové sítě; počítání objektů; zpracování obrazu
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/199407