Extrakce textu z PDF

Loading...
Thumbnail Image
Date
ORCID
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Práce se zabývá extrakcí textu z dokumentu PDF, obsahující především vícesloupcový text. Je zde popsána struktura PDF a rozbor získání textu z PDF. Práce se dále zaměřuje na návrh a implementaci algoritmu vylepšujicí extrakci textu.
Bachelor's thesis is concerned with text extraction from PDF dokument which contains mainly multi-column text. There's a description of PDF structure and analysis of text extraction from PDF document. Thesis is focused on suggestion of algorithm's implementation of improving text extraction.
Description
Citation
KUBÍK, P. Extrakce textu z PDF [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. RNDr. Jitka Kreslíková, CSc. (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) Ing. Vítězslav Beran, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)
Date of acceptance
2010-06-17
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Z hlediska zapojení systému je velmi důležité znát časovou náročnost převodu. Jaká je časová náročnost u převodu pomocí Vašeho systému a jak je na tom ve srovnání s původní verzí systému? Jak je možné, že rychlost převodu je ve vaší implementaci rychlejší u většího souboru, než menšího souboru (v tabulce porovnání)?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO