Aktivní učení pro rozpoznávání textu

but.committeedoc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Vítězslav Beran, Ph.D. (člen) doc. RNDr. Aleš Horák, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Kolik hodin jste strávil manuální anotací s aktivním učením? Jak rozezná CTC (Connectionist Temporal Classification) opakovaná písmena? Např.: met vs meet Jak proporce rozdílu validační a trénovací chybou v rovnici 4.1 zachycuje míru přetrénovanosti? Popište Obraz 6.7. Jaký si z něj čtenář má odnést poznatek?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHradiš, Michalcs
dc.contributor.authorKohút, Jancs
dc.contributor.refereeKolář, Martincs
dc.date.accessioned2020-06-23T07:17:19Z
dc.date.available2020-06-23T07:17:19Z
dc.date.created2019cs
dc.description.abstractCílem této práce je navrhnout metody aktivního učení a provést experimenty nad datovou sadou historických dokumentů. Pro experimenty využívám rozsáhlý a rozmanitý dataset IMPACT o více než jednom milionu řádků. Pomocí neuronových sítí provádím kontrolu vhodnosti řádků, tzn. čitelnosti a správnosti přepisů. Nejprve srovnávám architektury neuronových sítí, a to jak sítě čistě konvoluční, tak sítě obsahující obousměrnou rekurentní vrstvu LSTM. Dále se zabývám přístupy k učení neuronových sítí pomocí aktivního učení a samotnými metodami aktivního učení. Aktivní učení využívám zejména pro adaptaci neuronových sítí na jiné textové dokumenty, než na kterých byla původní síť učena. Aktivní učení tedy slouží k výběru vhodných adaptačních dat. Čistě konvoluční neuronové sítě dosahují úspěšnosti 98.6 %, rekurentní sítě pak 99.5 %. Chyba při adaptaci s využitím aktivního učení je o 26 % nižší než chyba při náhodném výběru dat.cs
dc.description.abstractThe aim of this Master's thesis is to design methods of active learning and to experiment with datasets of historical documents. A large and diverse dataset IMPACT of more than one million lines is used for experiments. I am using neural networks to check the readability of lines and correctness of their annotations. Firstly, I compare architectures of convolutional and recurrent neural networks with bidirectional LSTM layer. Next, I study different ways of learning neural networks using methods of active learning. Mainly I use active learning to adapt neural networks to documents that the neural networks do not have in the original training dataset. Active learning is thus used for picking appropriate adaptation data. Convolutional neural networks achieve 98.6\% accuracy, recurrent neural networks achieve 99.5\% accuracy. Active learning decreases error by 26\% compared to random pick of adaptations data.en
dc.description.markAcs
dc.identifier.citationKOHÚT, J. Aktivní učení pro rozpoznávání textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122166cs
dc.identifier.urihttp://hdl.handle.net/11012/180418
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectAktivní učenícs
dc.subjectrozpoznávání textucs
dc.subjectneuronové sítěcs
dc.subjectkonvoluční neuronové sítěcs
dc.subjectrekurentní neuronové sítěcs
dc.subjectdataset IMPACTcs
dc.subjectActive learningen
dc.subjecttext recognitionen
dc.subjectneural networksen
dc.subjectconvolutional neural networksen
dc.subjectrecurrent neural networksen
dc.subjectdataset IMPACTen
dc.titleAktivní učení pro rozpoznávání textucs
dc.title.alternativeActive Learning for OCRen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2019-06-19cs
dcterms.modified2019-07-08-13:31:31cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122166en
sync.item.dbtypeZPen
sync.item.insts2021.11.22 22:23:31en
sync.item.modts2021.11.22 21:32:24en
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
12.37 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-22021_v.pdf
Size:
85.91 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-22021_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-22021_o.pdf
Size:
89.46 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-22021_o.pdf
Loading...
Thumbnail Image
Name:
review_122166.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
review_122166.html
Collections