Original title:
Vyhledávání fotografií v databázi podle příkladu
Translated title:
Image Database Query by Example
Authors:
Dobrotka, Matúš ; Hradiš, Michal (referee) ; Veľas, Martin (advisor) Document type: Bachelor's theses
Year:
2015
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Táto práce se zabývá vyhledáváním fotografií v databázi podle příkladu. Práce byla vytvo\-ře\-na s cílem vyvinout aplikaci, která bude porovnávat různé přístupy vyhledávání fotografií v databázi. Jedná se o základní přístup, který spočívá v detekci klíčových bodů, extrakci lokálních příznaků a tvorbě vizuálního slovníku algoritmem shlukování - k-means. Pomocí vizuálního slovníku je spočítán histogram četnosti výskytu vizuálních slov - Bag of Words (BoW), který reprezentuje fotografii jako celek. Po aplikování vhodné metriky dojde k vyhledání podobných fotografií. Druhý přístup představují hluboké konvoluční neuronové sítě (DCNN), které jsou využity k extrakci příznakových vektorů. Tyto vektory jsou použity na tvorbu vizuálního slovníku, který slouží opět k výpočtu BoW. Postup je pak podobný jako v prvním přístupu. Třetí přístup počítá s extrahovanými vektory z DCNN jako s BoW vektory. Následuje aplikace vhodné metriky a vyhledání podobných fotografií. V závěru práce jsou popsány použity přístupy, uvedeny experimenty a závěrečné vyhodnocení.
This thesis deals with content-based image retrieval. The objective of the thesis is to develop an application, which will compare different approaches of image retrieval. First basic approach consists of keypoints detection, local features extraction and creating a visual vocabulary by clustering algorithm - k-means. Using this visual vocabulary is computed histogram of occurrence count of visual words - Bag of Words (BoW), which globally represents an image. After applying an appropriate metrics, it follows finding similar images. Second approach uses deep convolutional neural networks (DCNN) to extract feature vectors. These vectors are used to create a visual vocabulary, which is used to calculate BoW. Next procedure is then similar to the first approach. Third approach uses extracted vectors from DCNN as BoW vectors. It is followed by applying an appropriate metrics and finding similar images. The conclusion describes mentioned approaches, experiments and the final evaluation.
Keywords:
bag of words; clustering; convolution; deep convolutional neural networks; image retrieval; k-means; keypoint; local features; neural networks; SIFT; visual vocabulary; bag of words; hluboké konvoluční neuronové sítě; k-means; klíčový bod; konvoluce; lokální příznaky; neuronové sítě; shlukování; SIFT; vizuální slovník; vyhledávání fotografií
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/52402