Original title:
Alternativní vyhledávač systému EGOTHOR
Translated title:
Alternative search engine for EGOTHOR system
Authors:
Košalko, Martin ; Galamboš, Leo (referee) ; Kopecký, Michal (advisor) Document type: Master’s theses
Year:
2006
Language:
slo Abstract:
[eng][cze] Nowadays, it is necessary to process huge amount of information what is reflected by actual trends in informatics. The objective of the thesis is to give the theoretical analysis and implementation of processing and searching tool which allows the user to go through a huge number of unstructured document collections. Such system is called the information retrieval system. This work is an alternative to already existed system Egothor, which is the implementation of boolean model. Because of the possibility of comparing the results from retrieval system models, the implemented system is established on a competitive vector model. In this work is also created one modular system which allows comparing and processing the results from any independent information retrieval systems to one integrated review. This system is called the optimal retrieval system. The precision and recall - the subjective qualitative parameters of system are growing up. The optimal retrieval system was tested in configuration with two underlying systems what practically approved it's advantages.V současnosti roste potřeba zpracování velkého množství informací, čemuž se přizpůsobují i aktuální trendy v informatice. Cílem práce je teoretický rozbor a implementace nástroje určeného na zpracování a prohledávání velkých kolekcí nestrukturovaných textů - dokumentografického informačního systému (DIS). Práce navazuje na existující systém Egothor, který je implementací boolského modelu. Kvůli možnosti porovnávat výsledky různých modelů DIS, byl implementovaný systém založený na "konkurenčním" vektorovém modelu. V rámci diplomové práce byl vytvořený i modulární systém umožňující porovnávat a zpracovávat výsledky nezávislých DIS do jednoho uceleného přehledu. Takový systém se nazývá systém optimálního vyhledávání. Uživateli umožňuje najít takovou kombinaci vyhledávacích algoritmů, která je pro něj subjektivně optimální - maximalizují se subjektivně kvalitativní parametry systému, přesnost a úplnost. Systém optimálního vyhledávání byl otestovaný v konfiguraci se dvěma podřízenými DIS, co potvrdilo jeho výhody.
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/4451