Show simple item record

Optical Character Recognition Using Convolutional Networks

dc.contributor.advisorHradiš, Michalcs
dc.contributor.authorCsóka, Pavelcs
dc.date.accessioned2019-05-17T07:19:20Z
dc.date.available2019-05-17T07:19:20Z
dc.date.created2016cs
dc.identifier.citationCSÓKA, P. Rozpoznávání textu pomocí konvolučních sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.cs
dc.identifier.other96626cs
dc.identifier.urihttp://hdl.handle.net/11012/61794
dc.description.abstractTato práce se zabývá tvorbou nových datových sad pro účely strojového učení rozpoznávání textu z fotografií a experimenty s konvolučními neuronovými sítěmi na těchto sadách. Popisuje architekturu konvolučních sítí, problémy rozpoznávání z fotografií a současné práce využívající tyto sítě. Dále tvorbu anotace datové sady fotografií stránek dokumentů, pořízených mobilními telefony, nazvané Mobile Page Photos. K anotaci je využit Tesseract OCR. Z této sady jsou vyříznutím znaků z fotografií vytvořeny dvě další. Jedná se o sady znaků dobře čitelných Mobile Nice Page Photos Characters a dobře i spatně až nečitelných Mobile Page Photos Characters, ve formátu datové sady číslic Street View House Numbers. S třemi vytvořenými modely konvolučních sítí jsou na datových sadách provedeny experimenty s rozpoznáváním textu, s jejichž pomocí je také odhadnuta chyba anotace.cs
dc.description.abstractThis thesis aims at creation of new datasets for text recognition machine learning tasks and experiments with convolutional neural networks on these datasets. It describes architecture of convolutional nets, difficulties of recognizing text from photographs and contemporary works using these networks. Next, creation of annotation, using Tesseract OCR, for dataset comprised from photos of document pages, taken by mobile phones, named Mobile Page Photos. From this dataset two additional are created by cropping characters out of its photos formatted as Street View House Numbers dataset. Dataset Mobile Nice Page Photos Characters contains readable characters and Mobile Page Photos Characters adds hardly readable and unreadable ones. Three models of convolutional nets are created and used for text recognition experiments on these datasets, which are also used for estimation of annotation error.en
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectrozpoznávání textu z fotografiícs
dc.subjectanotace datové sadycs
dc.subjecttvorba datové sadycs
dc.subjectkonvoluční neuronová síťcs
dc.subjectstrojové učenícs
dc.subjectCaffecs
dc.subjectTesseract OCRcs
dc.subjectStreet View House Numberscs
dc.subjectMobile Page Photoscs
dc.subjectMobile Page Photos Characterscs
dc.subjecttext recognition from photographsen
dc.subjectdataset annotationen
dc.subjectdataset creationen
dc.subjectconvolutional neural networken
dc.subjectmachine learningen
dc.subjectCaffeen
dc.subjectTesseract OCRen
dc.subjectStreet View House Numbersen
dc.subjectMobile Page Photosen
dc.subjectMobile Page Photos Charactersen
dc.titleRozpoznávání textu pomocí konvolučních sítícs
dc.title.alternativeOptical Character Recognition Using Convolutional Networksen
dc.typeTextcs
dcterms.dateAccepted2016-06-17cs
dcterms.modified2016-08-29-10:15:35cs
thesis.disciplinePočítačová grafika a multimédiacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
sync.item.dbid96626en
sync.item.dbtypeZPen
sync.item.insts2019.06.21 08:42:39en
sync.item.modts2019.05.18 22:48:18en
dc.contributor.refereeBehúň, Kamilcs
dc.description.markBcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record