Show simple item record

Convolutional Networks for Historic Text Recognition

dc.contributor.advisorHradiš, Michalcs
dc.contributor.authorKišš, Martincs
dc.date.accessioned2019-04-03T22:25:45Z
dc.date.available2019-04-03T22:25:45Z
dc.date.created2018cs
dc.identifier.citationKIŠŠ, M. Rozpoznávání historických textů pomocí hlubokých neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018.cs
dc.identifier.other114758cs
dc.identifier.urihttp://hdl.handle.net/11012/84895
dc.description.abstractCílem této práce je vytvořit nástroj pro automatický přepis textu historických dokumentů. Práce je zaměřena především na rozpoznávání textů pocházejících z období novověku psané písmem zvané Fraktura. Problém je řešen pomocí nově navržených rekurentních konvolučních neuronových sítí a také pomocí sítě zvané Spatial Transformer Network. Součástí řešení je také implementovaný generátor umělých historických textů. Pomocí tohoto generátoru je vytvořena umělá datová sada, na níž je natrénována konvoluční neuronová síť pro rozpoznávání řádků. Tato síť je následně otestována na reálných historických řádcích textu, na kterých natrénovaná sít dosahuje úspešnosti až 89.0 % znakové přesnosti. Přínosem této práce je především nově navržená neuronová síť pro rozpoznávání řádků textu a implementovaný generátor umělých historických textů, s jehož pomocí je možné natrénovat neuronovou síť tak, aby zvládala rozpoznávat reálné historické řádky textu.cs
dc.description.abstractThe aim of this work is to create a tool for automatic transcription of historical documents. The work is mainly focused on the recognition of texts from the period of modern times written using font Fraktur. The problem is solved with a newly designed recurrent convolutional neural networks and a Spatial Transformer Network. Part of the solution is also an implemented generator of artificial historical texts. Using this generator, an artificial data set is created on which the convolutional neural network for line recognition is trained. This network is then tested on real historical lines of text on which the network achieves up to 89.0 % of character accuracy. The contribution of this work is primarily the newly designed neural network for text line recognition and the implemented artificial text generator, with which it is possible to train the neural network to recognize real historical lines of text.en
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectPřepis textucs
dc.subjectOCRcs
dc.subjecthistorický textcs
dc.subjectrekurentní neuronové sítěcs
dc.subjectRNNcs
dc.subjectSpatial Transformer Networkcs
dc.subjectSTNcs
dc.subjectgenerátor umělé historické datové sadycs
dc.subjectText recognitionen
dc.subjectOCRen
dc.subjecthistorical texten
dc.subjectrecurrent neural networksen
dc.subjectRNNen
dc.subjectSpatial Transformer Networken
dc.subjectSTNen
dc.subjectartificial historical dataset generatoren
dc.titleRozpoznávání historických textů pomocí hlubokých neuronových sítícs
dc.title.alternativeConvolutional Networks for Historic Text Recognitionen
dc.typeTextcs
dcterms.dateAccepted2018-06-18cs
dcterms.modified2020-05-10-16:13:21cs
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
sync.item.dbid114758en
sync.item.dbtypeZPen
sync.item.insts2020.06.23 10:22:42en
sync.item.modts2020.06.23 09:14:53en
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
dc.contributor.refereeZemčík, Pavelcs
dc.description.markBcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
but.committeedoc. Ing. František Zbořil, CSc. (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) doc. Ing. Radomil Matoušek, Ph.D. (člen) Dr. Ing. Petr Peringer (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: V práci uvádíte (strana 37), že u některých znaků při rozpoznávání dochází k záměně nebo ke spojení. Nebylo by v takových případech možné využít znalosti o pravděpodobných slovech v textu a "vylepšit" tak rozpoznávání? Na základě Vašich výsledků úspěšnosti při rozpoznávání znaků (u=89%), lze odhadnout úspěšnost rozpoznání celých slov? (Je to prosté u^n, kde n je počet znaků, nebo je to jinak?)cs
but.resultpráce byla úspěšně obhájenacs
but.programInformační technologiecs
but.jazykčeština (Czech)


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record