Filtrování textů extrahovaných z PDF, OCR nebo webu

but.committeedoc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen) Dr. Ing. Petr Peringer (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSzőke, Igorcs
dc.contributor.authorŽigárdi, Tomášcs
dc.contributor.refereePlchot, Oldřichcs
dc.date.accessioned2019-06-14T10:52:10Z
dc.date.available2019-06-14T10:52:10Z
dc.date.created2013cs
dc.description.abstractTato bakalářská práce se zabývá normalizací textů vzniklých převedením z různých formátů a vytvořením výslovnostních slovníků. Jednou z jejich možností využití je například při strojovém zpracování řeči. Analyzovány jsou chyby, které vznikají při převodu a původní řešení tohoto problému. Dále je uveden návrh a implementace normalizačních kroků a výslovnostních slovníků. Výsledky implementovaného řešení jsou vyhodnoceny a porovnány s existujícím řešením.cs
dc.description.abstractThis bachelor thesis describes normalization of texts created by conversion of other formats and creation of pronunciation dictionaries. They are important in speech processing process. Mistakes caused by conversion and original solution of this problem are analyzed. Design and implementation of normalization steps and pronunciation dictionaries is shown. Results are compared with results of original solution of this problem.en
dc.description.markCcs
dc.identifier.citationŽIGÁRDI, T. Filtrování textů extrahovaných z PDF, OCR nebo webu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.cs
dc.identifier.other79605cs
dc.identifier.urihttp://hdl.handle.net/11012/54938
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectNormalizace textucs
dc.subjectOCRcs
dc.subjectPDFcs
dc.subjectvýslovnostní slovníkycs
dc.subjectregulární výrazcs
dc.subjectBashcs
dc.subjectPerlcs
dc.subjectAwkcs
dc.subjectText normalizationen
dc.subjectOCRen
dc.subjectPDFen
dc.subjectpronunciation dictionariesen
dc.subjectregular expressionen
dc.subjectBashen
dc.subjectPerlen
dc.subjectAwken
dc.titleFiltrování textů extrahovaných z PDF, OCR nebo webucs
dc.title.alternativeFiltering of Texts Extracted from PDF, OCR or Weben
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2013-06-10cs
dcterms.modified2020-05-10-16:11:24cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid79605en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 21:00:10en
sync.item.modts2021.11.12 20:28:37en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.26 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_79605.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
review_79605.html
Collections