Název:
Vyhledávání fotografií v databázi podle příkladu
Překlad názvu:
Image Database Query by Example
Autoři:
Dobrotka, Matúš ; Hradiš, Michal (oponent) ; Veľas, Martin (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2015
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Táto práce se zabývá vyhledáváním fotografií v databázi podle příkladu. Práce byla vytvo\-ře\-na s cílem vyvinout aplikaci, která bude porovnávat různé přístupy vyhledávání fotografií v databázi. Jedná se o základní přístup, který spočívá v detekci klíčových bodů, extrakci lokálních příznaků a tvorbě vizuálního slovníku algoritmem shlukování - k-means. Pomocí vizuálního slovníku je spočítán histogram četnosti výskytu vizuálních slov - Bag of Words (BoW), který reprezentuje fotografii jako celek. Po aplikování vhodné metriky dojde k vyhledání podobných fotografií. Druhý přístup představují hluboké konvoluční neuronové sítě (DCNN), které jsou využity k extrakci příznakových vektorů. Tyto vektory jsou použity na tvorbu vizuálního slovníku, který slouží opět k výpočtu BoW. Postup je pak podobný jako v prvním přístupu. Třetí přístup počítá s extrahovanými vektory z DCNN jako s BoW vektory. Následuje aplikace vhodné metriky a vyhledání podobných fotografií. V závěru práce jsou popsány použity přístupy, uvedeny experimenty a závěrečné vyhodnocení.
This thesis deals with content-based image retrieval. The objective of the thesis is to develop an application, which will compare different approaches of image retrieval. First basic approach consists of keypoints detection, local features extraction and creating a visual vocabulary by clustering algorithm - k-means. Using this visual vocabulary is computed histogram of occurrence count of visual words - Bag of Words (BoW), which globally represents an image. After applying an appropriate metrics, it follows finding similar images. Second approach uses deep convolutional neural networks (DCNN) to extract feature vectors. These vectors are used to create a visual vocabulary, which is used to calculate BoW. Next procedure is then similar to the first approach. Third approach uses extracted vectors from DCNN as BoW vectors. It is followed by applying an appropriate metrics and finding similar images. The conclusion describes mentioned approaches, experiments and the final evaluation.
Klíčová slova:
bag of words; hluboké konvoluční neuronové sítě; k-means; klíčový bod; konvoluce; lokální příznaky; neuronové sítě; shlukování; SIFT; vizuální slovník; vyhledávání fotografií; bag of words; clustering; convolution; deep convolutional neural networks; image retrieval; k-means; keypoint; local features; neural networks; SIFT; visual vocabulary
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/52402