Externí metrické hašovaní pomocí D-indexu
External Metric Hashing using the D-index
Jakl, Jiří ; Lokoč, Jakub (referee) ; Skopal, Tomáš (advisor) Document type: Master’s theses
[cze][eng] Cílem této práce bylo implementovat relativně novou datovou strukturu D-Index, prověřit chování této metrické přístupové metody a srovnat její efektivitu s jinými indexačními metodami. Jako referenční metody byly zvoleny M-Strom, PM-Strom a LAESA (aproximovaná pomocí PM-Stromu, který obsahuje pouze listové pivoty). Měření výkonu a porovnání bylo provedeno na různých typech dat s odlišnou distribucí vzdáleností. V této práci je struktura D-Indexu navržena pro podporu automatické výstavby indexu podle počátečního nastavení parametrů a dynamického vkládání. Mimo samotné implementace D-Indexu byly prověřeny i vlastnosti této indexační metody. Pro dosažení potřebné exibility a dostatečného výkonu řešení bylo v průběhu návrhu a implementace kladeno velké úsilí na optimalizaci a objektovou realizaci. To umožňuje zkoušení nových způsobů volby interních parametrů a naměření relevantních výsledků metody. Jako část popisu metrických přístupových metod byly uvedeny jejich společné principy založené na vlastnostech metrických prostorů. Práce pokryla vybrané metrické funkce, metody volby pivotů a některé problémy metrických přístupových metod.The goal of this work was to implement recently presented data structure D-Index, to investigate behaviour of this metric access method and to compare its eciency with other indexing methods. As reference, M-Tree, PM-Tree and LAESA (approximated as PM-Tree with leaf pivots only) indexing methods were chosen. Performance measurements and comparison were done on various types of data with dierent distribution of distances.In this work, the D-Index structure was designed to support automatic build up of the index according to initial parameter setup and to allow dynamic insertion as well. Beside implementation of D-Index, an investigation of features of this indexing method was done. To achieve exibility and sucient performance of the solution, great eort was put on optimization and object realization. This allowed testing new ideas for choosing internal parameters and obtaining relevant results from measuring of investigated methods. The common principles (based on properties of metric spaces) of metric access methods were presented as part of their description. This work covered selected metric functions, several pivot selections and some aws of metric access methods.
