Extrakce informací z webových stránek
but.committee | prof. Ing. Tomáš Hruška, CSc. (předseda) doc. Dr. Ing. Dušan Kolář (místopředseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Mgr. Kamil Malinka, Ph.D. (člen) doc. Ing. Jiří Rybička, Dr. (člen) RNDr. Marek Rychlý, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Popište možný způsob rozšíření aplikace o další komponenty pro stahování a extrakci. | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Burget, Radek | cs |
dc.contributor.author | Bukovčák, Jakub | cs |
dc.contributor.referee | Rychlý, Marek | cs |
dc.date.accessioned | 2019-07-08T15:57:00Z | |
dc.date.available | 2019-07-08T15:57:00Z | |
dc.date.created | 2019 | cs |
dc.description.abstract | Táto diplomová práca sa zaoberá súčasným stavom technológií používaných na sťahovanie webových stránok a extrakciou štruktúrovaných informácií z nich. Popisuje dostupné nástroje, ktoré umožňujú a zjednodušujú tento proces. Ďalej sa venuje základnému prehľadu technológií používaných pre vytváranie webových stránok. Nachádzajú sa tu informácie o tvorbe informačných systémov s webovým používateľským rozhraním v prostredí Java Enterprise Edition (Java EE). Hlavnou časťou je návrh a implementácia webovej aplikácie pre definíciu a správu extrakčných úloh. V závere je popísané testovanie aplikácie na reálnych webových stránkach a zhodnotenie dosiahnutých výsledkov. | cs |
dc.description.abstract | This master thesis is focused on current technologies that are used for downloading web pages and extraction of structured information from them. The paper describes available tools to make this process possible and easier. Another part of this document provides the overview of technologies that can be used for creating web pages. Also, there is an information about development of information systems with web user interface based on Java Enterprise Edition (Java EE) platform. The main part of this master thesis describes design and implementation of application used to specify and manage extraction tasks. The last part of this project describes application testing on real web pages and evaluation of achieved results. | en |
dc.description.mark | B | cs |
dc.identifier.citation | BUKOVČÁK, J. Extrakce informací z webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019. | cs |
dc.identifier.other | 122073 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/180394 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | HLRT wrapper | cs |
dc.subject | extrakcia informácií z HTML | cs |
dc.subject | Java EE | cs |
dc.subject | Web Crawling | cs |
dc.subject | sťahovanie HTML dokumentov | cs |
dc.subject | HLRT wrapper | en |
dc.subject | information extraction from HTML | en |
dc.subject | Java EE | en |
dc.subject | Web Crawling | en |
dc.subject | downloading HTML documents | en |
dc.title | Extrakce informací z webových stránek | cs |
dc.title.alternative | Information Extraction from Web Pages | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2019-06-20 | cs |
dcterms.modified | 2019-07-08-13:31:26 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 122073 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2021.11.12 15:20:04 | en |
sync.item.modts | 2021.11.12 14:06:41 | en |
thesis.discipline | Informační systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 4.72 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-21836_v.pdf
- Size:
- 85.57 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-21836_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-21836_o.pdf
- Size:
- 88.17 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-21836_o.pdf
Loading...
- Name:
- review_122073.html
- Size:
- 1.44 KB
- Format:
- Hypertext Markup Language
- Description:
- review_122073.html