Název:
Příznaky z videa pro klasifikaci
Překlad názvu:
Video Feature for Classification
Autoři:
Behúň, Kamil ; Herout, Adam (oponent) ; Hradiš, Michal (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2013
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce porovnává ručně-navrženy příznaky s příznaky naučenými metodami učení příznaků při klasifikací videa. Příznaky naučené pomocí Analýzy nezávislých podprostorů, Řídkými Autoenkodéry a vybělením Analýzou hlavních komponent byly otestovány v systému pro klasifikaci videa pomocí Bag of Words, ve kterém nahradily ručně-navrženy příznaky (např. SIFT, HOG, HOF). Úspěšnost klasifikace těchto naučených příznaků byla testována na datových sadách Human Motion DataBase a YouTube Action Data Set, kde ukázaly lepší výsledky než ručně-navrženy příznaky. Tato práce také ukazuje pomocí navržené metody inspirovanej metódami Multiple Kernel Learning, že při kombinaci naučených příznaků s ručně-navrženými příznaky lze dosáhnout ještě výraznější zlepšení úspěšnosti klasifikace videa a to i v případě, když ručně-navrženy příznaky a naučené příznaky samostatně nedosahují příliš velké úspěšnosti klasifikace.
This thesis compares hand-designed features with features learned by feature learning methods in video classification. The features learned by Principal Component Analysis whitening, Independent subspace analysis and Sparse Autoencoders were tested in a standard Bag of Visual Word classification paradigm replacing hand-designed features (e.g. SIFT, HOG, HOF). The classification performance was measured on Human Motion DataBase and YouTube Action Data Set. Learned features showed better performance than the hand-desined features. The combination of hand-designed features and learned features by Multiple Kernel Learning method showed even better performance, including cases when hand-designed features and learned features achieved not so good performance separately.
Klíčová slova:
Analýza hlavních komponent; Bag of Words; Klasifikace videa; Multiple Kernel Learning; Nezávislá analýza podprostoru; Support Vector Machine; učení příznaků; video příznaky; Řídké Autoenkodéry; Bag of Words; feature learning; Independent subspace analysis; Multiple Kernel Learning; Principal component analysis; Sparse Autoencoders; Support Vector Machine; Video Classification; video features
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/53510