Original title:
Detekce objektu s využitím hloubkových dat
Authors:
Valko, Marek ; Hradiš, Michal (referee) ; Musil, Petr (advisor) Document type: Bachelor's theses
Year:
2024
Language:
slo Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[slo][eng]
Táto bakalárska práca sa zaoberá detekciou objektov v obraze s využitím hĺbkových dát. Cieľom bolo zvoliť vhodné metódy hlbokého učenia a experimentálne ich overiť na relevantných dátových sadách. Práca začína prehľadom základných techník detekcie objektov v obraze a hĺbkových dátach. V rámci riešenia boli vybrané dátové sady NYU Depth v2 a Washington RGB-D, na ktorých sa testovali upravené modely YOLOv5 a YOLOv8. Experimenty skúmali rôzne reprezentácie hĺbkových informácií a analyzovali, ako integrácia hĺbkových dát zlepšuje výkon týchto modelov. Výsledky ukázali výrazné zlepšenie metrík mAP pri porovnaní s klasickými modelmi využívajúcimi iba RGB dáta. Integrácia hĺbkových dát tak umožnila dosiahnuť presnejšie a spoľahlivejšie výsledky pri detekcii objektov.
This bachelor thesis addresses the detection of objects in images using depth data. The goal was to select appropriate deep learning methods and experimentally verify them on relevant datasets. The thesis begins with an overview of basic techniques for detecting objects in images and depth data, utilizing selected datasets NYU Depth v2 and Washington RGB-D to test modified YOLOv5 and YOLOv8 models, adapted for effective processing of RGB-D data. The experiments explored various representations of depth information and analyzed how the integration of depth data enhances the performance of these models. The results demonstrated significant improvements in mAP metrics compared to traditional models that use only RGB data. The integration of depth data thus allowed for more accurate and reliable object detection results.
Keywords:
depth data; depth data representation; early and late fusion; HHA; jet; object detection; RGBD; YOLOv5; YOLOv8
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: https://hdl.handle.net/11012/247844