Název:
Rozšiřování dotazů pro vyhledávání medicínských informací
Překlad názvu:
Query expansion for medical information retrieval
Autoři:
Bibyna, Feraena ; Pecina, Pavel (vedoucí práce) ; Holub, Martin (oponent) Typ dokumentu: Diplomové práce
Rok:
2015
Jazyk:
eng
Abstrakt: [eng][cze] One of the challenges in medical information retrieval is the terminology gap between the documents (commonly written by medical professional, using medical jargons), and the queries (commonly composed by non professional, using layman terms). In this thesis, we investigate the effect of query expansion, using domain-specific knowledge resource, to deal with this challenge. We use the Unified Medical Language System (UMLS), a repository of biomedical vocabularies, and utilize two of its resources: the Metathesaurus and the Semantic Network. We use the query set and document set provided by CLEF eHealth organizer. The query sets, provided for the medical information retrieval shared task, represent two different use cases of medical information retrieval. We experiment with query expansion using synonymous terms and non-synonymous concepts, blind relevance feedback, field weighting, and linear interpolation of different systems. Powered by TCPDF (www.tcpdf.org)Jedním z problémů ve vyhledávání medicínských informací je terminologická "propast" mezi jazykem dokumentů (které jsou obvykle psané odborníky používajícími odbornou terminologii) a jazykem vyhledávacích dotazů (které jsou častěji tvořeny neodborníky používajícími především laické výrazy). V této diplomové práci zkoumáme možnosti řešení tohoto problému pomocí rozšiřování dotazů s využitím doménově specifických datových zdrojů. K tomuto používáme Unified Medical Language System (UMLS) obsahující sdružené biomedicínské názvosloví z několika zdrojů. Konkrétně používáme jeho metatezaurus a sémantickou síť. V experimentech používáme sadu dotazů z evaluační kampaně CLEF eHealth z let 2014 a 2015, které reprezentují dvě různé vyhledávací úlohy. Použité metody zahrnují rozšiřování dotazů pomocí synonymních i nesynonymních vztahů, metodu blind relevance feedback, vážení termů a také kombinování různých systémů pomocí lineární interpolace. Powered by TCPDF (www.tcpdf.org)
Klíčová slova:
ontologie; rozšiřování dotazů; tezaurus; UMLS; vyhledávání medicínských informací; medical information retrieval; ontology; query expansion; thesaurus; UMLS