Název:
Spojování záznamů v genealogických datech
Překlad názvu:
Record Linkage in Genealogical Data
Autoři:
Šorm, Jan ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2019
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Hlavním cílem této bakalářské práce je studium genealogických dat, zjištění možných problému při jejich slučování a implementace metod pro toto slučování dat. V této práci se bude především studovat problematika třídění podobných tvarů jmen do společných tříd. Tento problém se bude studovat zejména proto, že v každém matričním záznamu hrají nejdůležitější roli jména a příjmení dotčených osob a jejich příbuzných. V práci tedy bude rozebráno několik metrik pro výpočet vzdálenosti mezi dvěma řetězci. Dále pak pro tyto metriky bude provedeno několik experimentů, které budou mít za cíl roztřídit jména do tříd s co nejmenším počtem chyb. Na základě těchto výsledků pak budou provedeny i experimenty pro samotné slučování jednotlivých genealogických záznamů.
The main aim of this thesis is to study genealogical data, to find out possible problems in their merging and to implement methods for this data merging. In this thesis, it will be studied the problem of classifying similar names into common classes. This problem will be studied mainly because people's names and surnames play the most important role in every registry entry. In this thesis, it will be analyzed several metrics for calculating the distance between two strings. In addition, several experiments will be done for these metrics to classify names into classes with as few errors as possible. Based on these results, experiments for record linkage will be performed.
Klíčová slova:
C++; genealogie; matrika; slučování; třídy; vzdálenosti; záznamy; řetězce; C++; classes; distances; genealogy; merging; records; register; strings
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/180275