Show simple item record

Filtering of Texts Extracted from PDF, OCR or Web

dc.contributor.advisorSzőke, Igorcs
dc.contributor.authorŽigárdi, Tomášcs
dc.date.accessioned2019-06-14T10:52:10Z
dc.date.available2019-06-14T10:52:10Z
dc.date.created2013cs
dc.identifier.citationŽIGÁRDI, T. Filtrování textů extrahovaných z PDF, OCR nebo webu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.cs
dc.identifier.other79605cs
dc.identifier.urihttp://hdl.handle.net/11012/54938
dc.description.abstractTato bakalářská práce se zabývá normalizací textů vzniklých převedením z různých formátů a vytvořením výslovnostních slovníků. Jednou z jejich možností využití je například při strojovém zpracování řeči. Analyzovány jsou chyby, které vznikají při převodu a původní řešení tohoto problému. Dále je uveden návrh a implementace normalizačních kroků a výslovnostních slovníků. Výsledky implementovaného řešení jsou vyhodnoceny a porovnány s existujícím řešením.cs
dc.description.abstractThis bachelor thesis describes normalization of texts created by conversion of other formats and creation of pronunciation dictionaries. They are important in speech processing process. Mistakes caused by conversion and original solution of this problem are analyzed. Design and implementation of normalization steps and pronunciation dictionaries is shown. Results are compared with results of original solution of this problem.en
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectNormalizace textucs
dc.subjectOCRcs
dc.subjectPDFcs
dc.subjectvýslovnostní slovníkycs
dc.subjectregulární výrazcs
dc.subjectBashcs
dc.subjectPerlcs
dc.subjectAwkcs
dc.subjectText normalizationen
dc.subjectOCRen
dc.subjectPDFen
dc.subjectpronunciation dictionariesen
dc.subjectregular expressionen
dc.subjectBashen
dc.subjectPerlen
dc.subjectAwken
dc.titleFiltrování textů extrahovaných z PDF, OCR nebo webucs
dc.title.alternativeFiltering of Texts Extracted from PDF, OCR or Weben
dc.typeTextcs
dcterms.dateAccepted2013-06-10cs
dcterms.modified2020-05-10-16:11:24cs
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
sync.item.dbid79605en
sync.item.dbtypeZPen
sync.item.insts2020.06.23 10:59:54en
sync.item.modts2020.06.23 10:02:44en
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
dc.contributor.refereePlchot, Oldřichcs
dc.description.markCcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
but.committeedoc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Petr Matoušek, Ph.D. (člen) Dr. Ing. Petr Peringer (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.cs
but.resultpráce byla úspěšně obhájenacs
but.programInformační technologiecs
but.jazykčeština (Czech)


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record