Original title:
Rozšiřování dotazů pro vyhledávání medicínských informací
Translated title:
Query expansion for medical information retrieval
Authors:
Bibyna, Feraena ; Pecina, Pavel (advisor) ; Holub, Martin (referee) Document type: Master’s theses
Year:
2015
Language:
eng Abstract:
[eng][cze] One of the challenges in medical information retrieval is the terminology gap between the documents (commonly written by medical professional, using medical jargons), and the queries (commonly composed by non professional, using layman terms). In this thesis, we investigate the effect of query expansion, using domain-specific knowledge resource, to deal with this challenge. We use the Unified Medical Language System (UMLS), a repository of biomedical vocabularies, and utilize two of its resources: the Metathesaurus and the Semantic Network. We use the query set and document set provided by CLEF eHealth organizer. The query sets, provided for the medical information retrieval shared task, represent two different use cases of medical information retrieval. We experiment with query expansion using synonymous terms and non-synonymous concepts, blind relevance feedback, field weighting, and linear interpolation of different systems. Powered by TCPDF (www.tcpdf.org)Jedním z problémů ve vyhledávání medicínských informací je terminologická "propast" mezi jazykem dokumentů (které jsou obvykle psané odborníky používajícími odbornou terminologii) a jazykem vyhledávacích dotazů (které jsou častěji tvořeny neodborníky používajícími především laické výrazy). V této diplomové práci zkoumáme možnosti řešení tohoto problému pomocí rozšiřování dotazů s využitím doménově specifických datových zdrojů. K tomuto používáme Unified Medical Language System (UMLS) obsahující sdružené biomedicínské názvosloví z několika zdrojů. Konkrétně používáme jeho metatezaurus a sémantickou síť. V experimentech používáme sadu dotazů z evaluační kampaně CLEF eHealth z let 2014 a 2015, které reprezentují dvě různé vyhledávací úlohy. Použité metody zahrnují rozšiřování dotazů pomocí synonymních i nesynonymních vztahů, metodu blind relevance feedback, vážení termů a také kombinování různých systémů pomocí lineární interpolace. Powered by TCPDF (www.tcpdf.org)
Keywords:
medical information retrieval; ontology; query expansion; thesaurus; UMLS; ontologie; rozšiřování dotazů; tezaurus; UMLS; vyhledávání medicínských informací
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/81196