Analýza a získávání informací ze souboru dokumentů spojených do jednoho celku

but.committeedoc. Dr. Ing. Petr Hanáček (předseda) prof. Ing. Martin Drahanský, Ph.D. (místopředseda) doc. Ing. Vladimír Drábek, CSc. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen) doc. Ing. Václav Zeman, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: Uvažoval jste o využití tzv. stemmingu při předzpracování textu? Mělo by to pro vaši úlohu význam? Popište, jakým způsobem byl vytvořen rozhodovací strom na str. 34.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKreslíková, Jitkacs
dc.contributor.authorJarolím, Jordáncs
dc.contributor.refereeBartík, Vladimírcs
dc.date.accessioned2019-04-03T22:25:43Z
dc.date.available2019-04-03T22:25:43Z
dc.date.created2018cs
dc.description.abstractTato práce se zabývá získáváním relevantních informací z dokumentů, automatizovaným rozdělováním vícero dokumentů spojených do jednoho celku a tvorbou nástroje, který umožňuje získání relevantních informací z dokumentů a jejich automatizované rozdělení. Jsou diskutovány především metody pro získání textových dat ze skenovaných dokumentů, rozpoznávání pojmenovaných entit, shlukování dokumentů, jejich podpůrné algoritmy a jsou popisovány metriky sloužící pro automatizované rozdělování dokumentů. Dále je vysvětlen algoritmus implementovaného prototypu daného systému, jsou popsány použité nástroje a techniky a je evaluována jeho úspěšnost. Nakonec jsou diskutována možná rozšíření a budoucí rozvoj této práce.cs
dc.description.abstractThis thesis deals with mining of relevant information from documents and automatic splitting of multiple documents merged together. Moreover, it describes the design and implementation of software for data mining from documents and for automatic splitting of multiple documents. Methods for acquiring textual data from scanned documents, named entity recognition, document clustering, their supportive algorithms and metrics for automatic splitting of documents are described in this thesis. Furthermore, an algorithm of implemented software is explained and tools and techniques used by this software are described. Lastly, the success rate of the implemented software is evaluated. In conclusion, possible extensions and further development of this thesis are discussed at the end.en
dc.description.markCcs
dc.identifier.citationJAROLÍM, J. Analýza a získávání informací ze souboru dokumentů spojených do jednoho celku [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018.cs
dc.identifier.other114762cs
dc.identifier.urihttp://hdl.handle.net/11012/84912
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectDokumentcs
dc.subjectspojené dokumentycs
dc.subjectrozdělovánícs
dc.subjectautomatické rozdělování dokumentůcs
dc.subjectzískávání informacícs
dc.subjectrozpoznávání pojmenovaných entitcs
dc.subjectRAKEcs
dc.subjectSIFT pointscs
dc.subjecthistogramcs
dc.subjectK-meanscs
dc.subjectmetrické prostorycs
dc.subjectvektorové prostorycs
dc.subjecteuklidova vzdálenostcs
dc.subjectcosinova podobnostcs
dc.subjectshlukování dokumentůcs
dc.subjectDocumenten
dc.subjectmerged documentsen
dc.subjectsplittingen
dc.subjectautomatic document splittingen
dc.subjectdata miningen
dc.subjectnamed entity recognitionen
dc.subjectRAKEen
dc.subjectSIFT pointsen
dc.subjecthistogramen
dc.subjectK-meansen
dc.subjectmetric spacesen
dc.subjectvector spacesen
dc.subjecteuclid distanceen
dc.subjectcosine similarityen
dc.subjectdocument clusteringen
dc.titleAnalýza a získávání informací ze souboru dokumentů spojených do jednoho celkucs
dc.title.alternativeAnalysis and Data Extraction from a Set of Documents Merged Togetheren
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2018-06-21cs
dcterms.modified2020-05-10-16:13:21cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid114762en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 10:12:23en
sync.item.modts2021.11.12 08:51:43en
thesis.disciplineBezpečnost informačních technologiícs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
7.05 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-20912_o.pdf
Size:
89.51 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-20912_o.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-20912_v.pdf
Size:
86.95 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-20912_v.pdf
Loading...
Thumbnail Image
Name:
review_114762.html
Size:
1.49 KB
Format:
Hypertext Markup Language
Description:
review_114762.html
Collections