Original title:
Detekce osob a hodnocení jejich pohlaví a věku v obrazových datech
Translated title:
Detection of persons and evaluation of gender and age in image data
Authors:
Dobiš, Lukáš ; Vičar, Tomáš (referee) ; Kolář, Radim (advisor) Document type: Master’s theses
Year:
2020
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[eng][cze]
Táto diplomová práca sa venuje automatickému rozpoznávaniu ludí v obrazových dátach s využitím konvolučných neurónových sieti na určenie polohy tváre a následnej analýze získaných dát. Výsledkom analýzy tváre je určenie pohlavia, emócie a veku osoby. Práca obsahuje popis použitých architektúr konvolučných sietí pre každú podúlohu. Sieť na odhad veku má natrénované nové váhy, ktoré sú vzápätí zmrazené a majú do svojej architektúry vložené LSTM vrstvy. Tieto vrstvy sú samostatne dotrénované a testované na novom datasete vytvorenom pre tento účel. Výsledky testov ukazujú zlepšenie predikcie veku. Riešenie pre rýchlu, robustnú a modulárnu detekciu tváre a ďalších ludských rysov z jedného obrazu alebo videa je prezentované ako kombinácia prepojených konvolučných sietí. Tieto sú implementované v podobe skriptu a následne vysvetlené. Ich rýchlosť je dostatočná pre ďalšie dodatočné analýzy tváre na živých obrazových dátach.
This master thesis describes an approach for automated human recognition by using convolutional neural networks (CNN) to perform facial analysis of persons face in image data. The predicted biometric indicators are following: age, gender, facial landmarks and facial expression. CNN architectures with pretrained weights for each task are described. Age estimation CNN has new weights trained and freezed, then has added new LSTM layers into its architecture. New LSTM layers are trained and tested on newly created video data set. Test results indicate improved age prediction accuracy. Solution for human recognition inference with single image and time series variants, in form of script with interconnected CNNs is explained, and its inference speed performance supports further proposed expansion plans for live video inference.
Keywords:
detekcia tváre; hlboké učenie; klasifikácia emócií; klasifikácia pohlavia; konvolučné neurónové sieťe; LSTM; odhad veku; počítačové videnie; Pytorch; age estimation; computer vision; convolutional neural networks; deep learning; emotion classification; face detection; gender classification; long short-term memory; Pytorch
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/189151