Rozpoznání textu s využitím neuronových sítí

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato diplomová práce se zabývá rozpoznáváním textu v obraze. V první části práce jsou popsány základní typy úloh rozpoznání textu a rozdělení algoritmu na jednotlivé fáze. Pro každou fázi jsou v následující části popsány nejpoužívanější metody. V rámci fáze rozpoznávání znaků je vysvětlena problematika umělých neuronových sítí a jejich využití v této fázi, konkrétně vícevrstvého perceptronu a konvolučních neuronových sítí. Druhá část se zabývá definicí požadavků na konkrétní aplikaci využitelnou jako zpětná vazba pro robotický systém. Je představena implementace algoritmu v .NET využívající konvoluční neuronové sítě a knihovnu CNTK pro hluboké učení. V neposlední řadě jsou diskutovány výsledky testování jednotlivých fází navrženého řešení a porovnány s volně dostupnou technikou Tesseract.
This master’s thesis deals with optical character recognition. The first part describes the basic types of optical character recognition tasks and divides algorithm into individual phases. For each phase the most commonly used methods are described in the next part. Within the character recognition phase the problematics of artificial neural networks and their usage in given phase is explained, specifically multilayer perceptron and convolutional neural networks. The second part deals with requirements definition for specific application to be used as feedback for robotic system. Convolution neural networks and CNTK library for deep learning using algorithm implementation in .NET is introduced. Finally, the test results of the individual phases of the proposed solution and the comparison with the open source Tesseract engine are discussed.
Description
Citation
PEŘINOVÁ, B. Rozpoznání textu s využitím neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Biomedicínské inženýrství a bioinformatika
Comittee
doc. Ing. Jana Kolářová, Ph.D. (předseda) prof. Pharm.Dr. Petr Babula, Ph.D. (místopředseda) Ing. Roman Jakubíček, Ph.D. (člen) RNDr. Jiří Jarkovský, Ph.D. (člen) Ing. Marina Ronzhina, Ph.D. (člen) Ing. Martin Mézl, Ph.D. (člen)
Date of acceptance
2018-06-13
Defence
Studentka prezentovala výsledky své práce a komise byla seznámena s posudky. Ing. Ronzhina položila otázku, kolik jste měla klasifikačních tříd a co to bylo za třídy? Na výstupu jste měla pravděpodobnosti jednotlivých slov? Trénovací a testovací sady se překrývají? Je pro tento robotický systém, možná nějaká biomedicínská aplikace? Ing. Jakubíček položil otázku, jak spojujete slova? Jak jste extrahovala příznaky v kroku rozpoznání? V čem je přínos a výhoda vašeho řešení v porovnání s Tesseractem? Doc. Kolářová položila otázku, s jakou firmou jste v rámci své práce navázala kontakt? Studentka obhájila diplomovou práci a odpověděla na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO