Original title:
Kolektivní propojování entit pro aplikaci ClueMaker
Translated title:
Collective Entity Matching Solution for ClueMaker Application
Authors:
Jaroschy, Petr ; Zavoral, Filip (advisor) ; Nečaský, Martin (referee) Document type: Master’s theses
Year:
2021
Language:
eng Abstract:
[eng][cze] ClueMaker (CM) is a Java desktop application used for data visualisation (via graph) by subjects like insurance companies (to unravel fraud activity), Czech organisation Hlí- dač Státu (to identify connections between subjects) or many others. This application currently uses a naive way to merge entities from different data sources (matching one field by exact string match). Goal of this thesis is to analyse, create and integrate a solution to CM, which would allow for merging entities based on entity similarity, and integrate such solution into the GUI of CM. Such solution should allow the user to merge two graph entities, show user the potentially same or very similar entities and allow for a global scan of the graph for potential merges. Furthermore, this solution should make use of data relationships within CM in addition to the attributes of entities. 1ClueMaker (CM) je Java aplikace, využitelná pro vizualizaci dat (na grafu) subjekty jako jsou pojištovny (pro odhalení podvodné aktivity), česká organizace Hlídač státu (pro identifikaci spojitostí mezi subjekty) a mnoha dalšími. Momentálně tato aplikace používá naivní způsob sjednocení entit z různých zdrojů dat (spojení na základě přesné rovnosti klíče). Cílem této práce je vymyslet, vybrat a integrovat řešení do CM, které by umožnilo sjednocování entit na základě jejich podobnosti, včetně vytvoření GUI pro tuto integraci. Toto řešení by mělo umožnit uživateli spojení podobných entit v grafu, zobrazení potenciálně shodných nebo podbných entit a provedení globálního skenu v momentálním grafu. Navíc, kromě využití podobnosti vlastností entit, toto řešení by mělo využít vztahy datových entit v CM. 1
Keywords:
Entity matching|Entity resolution|Record linkage; Propojování entit
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/148793