Název:
Detekce pohybujících se objektů ve videu s využitím neuronových sítí
Překlad názvu:
Object detection in video using neural networks
Autoři:
Mikulský, Petr ; Sikora, Pavel (oponent) ; Myška, Vojtěch (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2021
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Tato diplomová práce řeší detekci pohybujících se objektů ve videu s využitím neuronových sítí. Cílem práce byla detekce účastníků silničního provozu na video záznamech. Pro praktické řešení práce byl použit předtrénovaný detekční model YOLOv5. V rámci řešení byla vypracována vlastní datová množina ze záběrů dopravní komunikace s třídami: osobní automobil, autobus, dodávkový automobil, motocykl a kamion. Celkově finální podoba datové množiny čítá 5404 snímků a 6467 anotovaných objektů. Dotrénovaný model YOLOv5 dosáhl na testovací množině úspěšnosti detekce vozidel mAP 0,995, preciznosti 0,995 a úplnosti odhadu predikce 0,986. V závěru jsou popsány kroky, které vedly ke konečné podobě vlastního datasetu.
This diploma thesis deals with the detection of moving objects in a video recording using neural networks. The aim of the thesis was to detect road users in video recordings. Pre-trained YOLOv5 object detection model was used for a practical part of the thesis. As part of the solution, an own dataset of traffic road video recordings was created and annotated with following classes: a car, a bus, a van, a motorcycle, a truck and a trailer truck. Final version of this dataset comprise 5404 frames and 6467 annotated objects in total. After training, the YOLOv5 model achieved 0.995 mAP, 0.995 precision and 0.986 recall on the dataset. All steps leading to the final form of the dataset are described in the conclusion chapter.
Klíčová slova:
Detekce vozidel; konvoluční neuronové sítě; PyTorch; strojové učení; YOLOv5.; convolution neural networks; machine learning; PyTorch; Vehicle detection; YOLOv5.
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/196898