Original title:
Visipedia - Multi-dimensional Object Embedding Based on Perceptual Similarity
Translated title:
Visipedia - Multi-Dimensional Object Embedding Based on Perceptual Similarity
Authors:
Matera, Tomáš ; Hradiš, Michal (referee) ; Zemčík, Pavel (advisor) Document type: Master’s theses
Year:
2014
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Problémy jako je jemnozrnná kategorizace či výpočty s využitím lidských zdrojů se v posledních letech v komunitě stávají stále populárnějšími, což dosvědčuje i značné množství publikací na tato témata. Zatímco většina těchto prací využívá "klasických'' obrazových příznaků extrahovaných počítačem, tato se zaměřuje především na percepční vlastnosti, které nemohou být snadno zachyceny počítači a vyžadují zapojení lidí do procesu sběru dat. Práce zkoumá možnosti levného a efektivního získávání percepčních podobností od uživatelů rovněž ve vztahu ke škálovatelnosti. Dále vyhodnocuje několik relevantních experimentů a představuje metody zlepšující efektivitu sběru dat. Jsou zde také shrnuty a porovnány metody učení multidimenzionálního indexování a prohledávání tohoto prostoru. Získané výsledky jsou následně užity v komplexním experimentu vyhodnoceném na datasetu obrázků jídel. Procedura začíná získáváním podobností od uživatelů, pokračuje vytvořením multidimenzionálního prostoru jídel a končí prohledáváním tohoto prostoru.
Some problems like fine-grained categorization or human-based computation has become popular in recent years in the community, which has been proven by a large number of published works concerning these topics. Whereas most of these works uses a "classical'' visual features extracted by machine, this one in particular focuses on perceptual properties which cannot be easily sampled by machine and which involves humans into this data retrieval process. There are examined ways, how to obtain perceptual similarities from humans cheaply and effectively also in terms of scalability. There are performed various experiments and purposed several methods to improve this efficiency. The work also reviews and compares existing methods of embedding learning and navigating through its space. The acquired observations are subsequently used in a complex experiment evaluated with a food image dataset, covering the whole procedure from similarity retrieval from humans, over data embedding learning up to searching in such multi-dimensional space.
Keywords:
crowdsourcing; jemnozrnná kategorizace; mental matching; MTurk; multidimenzionální indexování dat; percepční podobnost; Visipedia; výpočty s využitím lidských zdrojů; získávání podobností; crowdsourcing; fine-grained categorization; human-based computation; mental matching; MTurk; multi-dimensional data embedding; perceptual similarity; similarity retrieval; Visipedia
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/53358