Active Learning pro zpracování archivních pramenů

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
V teto praci je reseno vytvoreni systemu, ktery umoznuje nahrani a anotaci skenu historickych dokumentu a nasledne aktivni doucovani modelu pro rozpoznavani znaku (OCR) na dostupnych anotacich (vyznacenych radcich a jejich prepisech). V praci je popsan proces, klasifikovany techniky a uveden existujici system pro rozpoznavani znaku. Predevsim je kladen duraz na metody strojoveho uceni. Dale jsou vysvetleny metody aktivniho uceni a navrhnut zpusob doucovani OCR modelu z anotovanych skenu. Zbytek prace se zabyva konkretnim navrhem, implementaci, dostupnymi datasety, vyhodnocenim uspesnosti rozpoznavani znaku vlastnorucne vytvoreneho OCR modelu a testovanim celeho systemu.
This work deals with the creation of a system that allows uploading and annotating scans of historical documents and subsequent active learning of models for character recognition (OCR) on available annotations (marked lines and their transcripts). The work describes the process, classifies the techniques and presents an existing system for character recognition. Above all, emphasis is placed on machine learning methods. Furthermore, the methods of active learning are explained and a method of active learning of available OCR models from annotated scans is proposed. The rest of the work deals with a system design, implementation, available datasets, evaluation of self-created OCR model and testing of the entire system.
Description
Citation
HŘÍBEK, D. Active Learning pro zpracování archivních pramenů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Strojové učení
Comittee
doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Martin Čadík, Ph.D. (místopředseda) Ing. David Bařina, Ph.D. (člen) doc. Ing. Lukáš Burget, Ph.D. (člen) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen)
Date of acceptance
2021-06-23
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Jakým způsobem by šel Váš systém propojit s jinými genealogickými systémy, jako je například DEMoS? Porovnal jste model bez použití dotrénování s modelem, který danou metodu používá?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO