Original title:
Odpovídání na otázky nad strukturovanými daty
Translated title:
Question Answering over Structured Data
Authors:
Birger, Mark ; Otrusina, Lubomír (referee) ; Smrž, Pavel (advisor) Document type: Master’s theses
Year:
2017
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Tato práce se zabývá problematikou odpovídání na otázky nad strukturovanými daty. Ve většině případů jsou strukturovaná data reprezentována pomocí propojených grafů, avšak ukrytí koncové struktury dát je podstatné pro využití podobných systémů jako součástí rozhraní s přirozeným jazykem. Odpovídající systém byl navržen a vyvíjen v rámci této práce. V porovnání s tradičními odpovídajícími systémy, které jsou založené na lingvistické analýze nebo statistických metodách, náš systém zkoumá poskytnutý graf a ve výsledků generuje sémantické vazby na základě vstupních párů otázka-odpověd'. Vyvíjený systém je nezávislý na struktuře dát, ale pro účely vyhodnocení jsme využili soubor dát z Wikidata a DBpedia. Kvalita výsledného systému a zkoumaného přístupu byla vyhodnocena s využitím připraveného datasetu a standartních metrik.
This thesis deals with question answering over structured data. In knowledge databases, a structured data is usually represented by graphs. However, to satisfy information needs using natural language interfaces the system is required to hide the underlying schema from users. A question answering system with a schema-agnostic graph-based approach was developed as a part of this work. In contrast to traditional question answering systems that rely on deep linguistic analysis and statistical methods, the developed system explores provided graph to yield and reuse semantic connection for a known question-answer pair. Lack of large domain-specific structured data made us perform evaluation with the help of prominent open linked datasets such as Wikidata and DBpedia. Quality of separate answering stages and the approach in general was evaluated using adapted evaluation dataset and standard metrics.
Keywords:
odpovídající systém; odpovídání nad strukturovanými daty; propojena data; přirozeně rozhraní; strukturovaná data; zpracování přirozeného jazyků; graph-based approach; linked data; natural interface; natural language processing; question answering over linked data; question answering system; schema-agnostic; structured data
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/69520