Extrakce informací z webových stránek

but.committeeprof. Ing. Tomáš Hruška, CSc. (předseda) doc. Dr. Ing. Dušan Kolář (místopředseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Mgr. Kamil Malinka, Ph.D. (člen) doc. Ing. Jiří Rybička, Dr. (člen) RNDr. Marek Rychlý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Popište možný způsob rozšíření aplikace o další komponenty pro stahování a extrakci.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBurget, Radekcs
dc.contributor.authorBukovčák, Jakubcs
dc.contributor.refereeRychlý, Marekcs
dc.date.accessioned2019-07-08T15:57:00Z
dc.date.available2019-07-08T15:57:00Z
dc.date.created2019cs
dc.description.abstractTáto diplomová práca sa zaoberá súčasným stavom technológií používaných na sťahovanie webových stránok a extrakciou štruktúrovaných informácií z nich. Popisuje dostupné nástroje, ktoré umožňujú a zjednodušujú tento proces. Ďalej sa venuje základnému prehľadu technológií používaných pre vytváranie webových stránok. Nachádzajú sa tu informácie o tvorbe informačných systémov s webovým používateľským rozhraním v prostredí Java Enterprise Edition (Java EE). Hlavnou časťou je návrh a implementácia webovej aplikácie pre definíciu a správu extrakčných úloh. V závere je popísané testovanie aplikácie na reálnych webových stránkach a zhodnotenie dosiahnutých výsledkov.cs
dc.description.abstractThis master thesis is focused on current technologies that are used for downloading web pages and extraction of structured information from them. The paper describes available tools to make this process possible and easier. Another part of this document provides the overview of technologies that can be used for creating web pages. Also, there is an information about development of information systems with web user interface based on Java Enterprise Edition (Java EE) platform. The main part of this master thesis describes design and implementation of application used to specify and manage extraction tasks. The last part of this project describes application testing on real web pages and evaluation of achieved results.en
dc.description.markBcs
dc.identifier.citationBUKOVČÁK, J. Extrakce informací z webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122073cs
dc.identifier.urihttp://hdl.handle.net/11012/180394
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectHLRT wrappercs
dc.subjectextrakcia informácií z HTMLcs
dc.subjectJava EEcs
dc.subjectWeb Crawlingcs
dc.subjectsťahovanie HTML dokumentovcs
dc.subjectHLRT wrapperen
dc.subjectinformation extraction from HTMLen
dc.subjectJava EEen
dc.subjectWeb Crawlingen
dc.subjectdownloading HTML documentsen
dc.titleExtrakce informací z webových stránekcs
dc.title.alternativeInformation Extraction from Web Pagesen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2019-06-20cs
dcterms.modified2019-07-08-13:31:26cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122073en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 15:20:04en
sync.item.modts2021.11.12 14:06:41en
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
4.72 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-21836_v.pdf
Size:
85.57 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-21836_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-21836_o.pdf
Size:
88.17 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-21836_o.pdf
Loading...
Thumbnail Image
Name:
review_122073.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
review_122073.html
Collections