Original title:
Redukce duplicitních výsledků
Translated title:
Results list reduction
Authors:
Píš, Ľuboš ; Malohlava, Michal (referee) ; Galamboš, Leo (advisor) Document type: Bachelor's theses
Year:
2008
Language:
cze Abstract:
[cze][eng] Táto bakalárska práca sa zaoberá implementáciou vhodného algoritmu redukcie duplicitných výsledkov do fulltextového vyhladávacieho stroja Egothor. Práca zahrna analýzu funkcionality systému Egothor a procesov pri vytváraní a spracovávaní indexu. Nasleduje popis existujúcich algoritmov redukcie duplicitných výsledkov a ich následné ohodnotenie a vzájomné porovnanie. Ohodnotenie popísaných algoritmov je primárne zamerané na prostredie webového vyhladávacieho systému Egothor, kde je vybraný ten najvhodnejší k implementácii. V rámci práce bol vybraný algoritmus kompletne naimplementovaný spolu s dalšími funkčnými požiadavkami. Popis výslednej implementácie uzatvára túto bakalársku prácu.This Bachelor's Diploma Thesis deals with implementation of a suitable algorithm of duplicate results' reduction into the full-text search engine Egothor. The thesis includes the functionality analysis of Egothor engine as well as the processes occurring during the creation and compilation of an index. The main focus is on the description of given algorithms of duplicate results' reduction followed by their evaluation and comparison. The evaluation of described algorithms is based on the web search engine system Egothor environment, where the most suitable one for the implementation is chosen. More speciffically, for the purpose of this thesis a completely implemented algorithm with further functional requirements is used. The conclusion consists of the description of the final implementation.
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/18575