Spojování záznamů v genealogických datech

but.committeedoc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Podle čeho určujete tzv. ground truth a jestli je to součástí vstupního souboru, jak tam poznáte, které záznamy mají být spojeny se kterýma záznamama? Mohl byste úspěšnost vašeho spojování záznamů vyjádřit pomocí true positive, true negative, false positive a false negative, případně pomocí F-measure? Existují již nějaké nástroje? Jak veliká je ground truth?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorZbořil, Františekcs
dc.contributor.authorŠorm, Jancs
dc.contributor.refereeRozman, Jaroslavcs
dc.date.accessioned2019-07-08T15:56:26Z
dc.date.available2019-07-08T15:56:26Z
dc.date.created2019cs
dc.description.abstractHlavním cílem této bakalářské práce je studium genealogických dat, zjištění možných problému při jejich slučování a implementace metod pro toto slučování dat. V této práci se bude především studovat problematika třídění podobných tvarů jmen do společných tříd. Tento problém se bude studovat zejména proto, že v každém matričním záznamu hrají nejdůležitější roli jména a příjmení dotčených osob a jejich příbuzných. V práci tedy bude rozebráno několik metrik pro výpočet vzdálenosti mezi dvěma řetězci. Dále pak pro tyto metriky bude provedeno několik experimentů, které budou mít za cíl roztřídit jména do tříd s co nejmenším počtem chyb. Na základě těchto výsledků pak budou provedeny i experimenty pro samotné slučování jednotlivých genealogických záznamů.cs
dc.description.abstractThe main aim of this thesis is to study genealogical data, to find out possible problems in their merging and to implement methods for this data merging. In this thesis, it will be studied the problem of classifying similar names into common classes. This problem will be studied mainly because people's names and surnames play the most important role in every registry entry. In this thesis, it will be analyzed several metrics for calculating the distance between two strings. In addition, several experiments will be done for these metrics to classify names into classes with as few errors as possible. Based on these results, experiments for record linkage will be performed.en
dc.description.markBcs
dc.identifier.citationŠORM, J. Spojování záznamů v genealogických datech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122189cs
dc.identifier.urihttp://hdl.handle.net/11012/180275
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectgenealogiecs
dc.subjectmatrikacs
dc.subjectzáznamycs
dc.subjectslučovánícs
dc.subjectřetězcecs
dc.subjectvzdálenostics
dc.subjecttřídycs
dc.subjectC++cs
dc.subjectgenealogyen
dc.subjectregisteren
dc.subjectrecordsen
dc.subjectmergingen
dc.subjectstringsen
dc.subjectdistancesen
dc.subjectclassesen
dc.subjectC++en
dc.titleSpojování záznamů v genealogických datechcs
dc.title.alternativeRecord Linkage in Genealogical Dataen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2019-06-10cs
dcterms.modified2019-07-08-13:31:32cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122189en
sync.item.dbtypeZPen
sync.item.insts2021.11.23 00:00:22en
sync.item.modts2021.11.22 23:05:42en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
718.43 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-22057_v.pdf
Size:
85.58 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-22057_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-22057_o.pdf
Size:
88.29 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-22057_o.pdf
Loading...
Thumbnail Image
Name:
review_122189.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
review_122189.html
Collections