Original title:
Matematický vyhledávač
Translated title:
Mathematical Search Engine
Authors:
Mišutka, Jozef ; Galamboš, Leo (advisor) ; Dvorský, Jiří (referee) ; Kohlhase, Michael (referee) Document type: Doctoral theses
Year:
2013
Language:
eng Abstract:
[eng][cze] Mathematics has been used to describe phenomena and problems in many re- search fields for centuries. The basic elements used in the description are formu- lae which express information symbolically. However, searching for mathematical knowledge in digital form using available tools is still cumbersome. We address this issue by presenting the mathematical search engine EgoMath, based on a full text searching, which can search for mathematical formulae and text. We perform an eval- uation over a large collection of documents showing that our solution is usable. Our approach can be used with huge document collections by applying one specialised technique. In order to provide a valuable evaluation of the quality, we built an al- ternative mathematical search engine using the feature extraction technique proposed by Ma et al. We propose important improvements to this solution achieving interest- ing results. We perform the first ever cross-evaluation of mathematical search engines based on different algorithms. A comprehensive survey of existing techniques avail- able, presented in this thesis, completes the picture of mathematical searching.Po celá staletí se matematika využívá k popisu jevů a problémů v mnoha oblastech výzkumu. Vzorce jsou základními kameny v jazyce matematiky, ale i přesto je hledání matematických vzorců v digitální podobě stále těžkopádné. Tato dizertační práce navrhuje řešení a představuje matematický vyhledávač EgoMath, založený na fulltex- tovém vyhledávání. Praktická použitelnost je potvrzena testy na velké sbírce doku- mentů. Také představíme techniku, díky které může být náš přístup použit na mno- honásobně větší kolekci dat. Aby bylo možné poskytnout cenné hodnocení kvality, vybudovali jsme alternativní matematický vyhledávač založený na práci Ma et al. Příslušná rozšíření umožňují dosažení zajímavých výsledků. Jako první provedeme srovnání dvou matematických vyhledávačů, které jsou postaveny na různých algo- ritmech. Vyčerpávající přehled stávajících používaných technik doplní obraz stavu výzkumu v oblasti matematického vyhledávání.
Keywords:
Full text search engine; Mathematical formulae; Mathematical search engine; Searching in mathematics; Matematické vzorce; Matematický vyhledávač; Textový vyhledávač; Vyhledávaní v matematice
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/52914