Název:
Strojové učení ze syntetické datové sady pro počítání přepravek v obraze
Překlad názvu:
Machine Learning on Synthetic Data for Counting Crates in Images
Autoři:
Koďousek, Ondřej ; Juránek, Roman (oponent) ; Herout, Adam (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2024
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Cílem práce je vytvořit proces, který spočítá kolik je ve videozáznamu či statickém snímku přepravek. Toho se dosáhne pomocí modelu, který je natrénován na syntetické datové sadě, a následně jsou výsledky upraveny na úrovni individuálních snímků a dále na úrovni souvislého videozáznamu. Tahle syntetická datový sada je vygenerována pomocí skriptu v programu Blender s využitím Octane Render, pro vyšší úroveň fotorealismu. Přínos úspěšného trénování na syntetické datové sadě je rychlejší a především automatické vytváření anotací. Jelikož se anotace generují se samotným snímkem, není problém vygenerovat velké množství snímku bez jediné manuální anotace. Dalším přínosem je náskok při vytváření modelu na detekci objektů, které jsou na trhu nové a nemají dostatek dat, případně jsou teprve ve výrobě. Detekoval jsem na statických snímkcích i ve videozáznamu, u obou případů jsem s modelem natrénovaným na syntetických datech dosahoval úspěšnosti nad 90%.
The goal of this work is to create a process that counts how many crates are in a video or still image. This is done by using a model that is trained on a synthetic dataset, and then the results are adjusted at the individual frame level and then at the continuous video frame level. This synthetic dataset is generated using a script in Blender using Octane Render, for a higher level of photorealism. The benefit of successfully training on the synthetic dataset is faster and especially automatic annotation. Since the annotations are generated with the image itself, it is not a problem to generate a large number of images without a single manual annotation. Another benefit is a head start in model generation for detecting objects that are new to the market and lack sufficient data, or are only in production. I have detected in still images and video, and in both cases I achieved success rates above 90% with a model trained on synthetic data.
Klíčová slova:
Blender; CenterNet; Octane Engine; počítání přepravek; strojové učení; syntetická datová sada; Blender; CenterNet; counting crates; machine learning; Octane Engine; synthetic dataset
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: https://hdl.handle.net/11012/246570