Extrakce textových dat z internetových stránek
but.committee | doc. Ing. Karel Němec, CSc. (předseda) doc. Ing. Václav Zeman, Ph.D. (místopředseda) Ing. Radomír Svoboda, Ph.D. (člen) doc. Ing. Lukáš Malina, Ph.D. (člen) Ing. Pavel Šilhavý, Ph.D. (člen) Ing. Zdeněk Martinásek, Ph.D. (člen) Ing. Ondřej Krajsa, Ph.D. (člen) | cs |
but.defence | Váš program pracuje s webovými stránkami pouze jednoho serveru. Jak byste změnil architekturu programu, aby bylo možné jednoduše přidat libovolný jiný server? V kapitole 2.8 uvádíte, že není možné editovat XML soubor. Je to skutečně pravda? Jaké máte možnosti pro úpravu XML souboru? Jaké má práce uplatnění? | cs |
but.jazyk | čeština (Czech) | |
but.program | Elektrotechnika, elektronika, komunikační a řídicí technika | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Červenec, Radek | cs |
dc.contributor.author | Troják, David | cs |
dc.contributor.referee | Morský, Ondřej | cs |
dc.date.accessioned | 2019-04-03T22:52:32Z | |
dc.date.available | 2019-04-03T22:52:32Z | |
dc.date.created | 2012 | cs |
dc.description.abstract | Tato práce se zabývá dolováním textových údajů z webových stránek, přehledem možných programů a způsoby extrakce textu. Součástí je program, vytvořený v programovacím jazyku Java, který umožňuje získávat textová data z konkrétních webových stránek a ukládat je do xml souboru. | cs |
dc.description.abstract | This work deals with text mining from web pages, an overview of available programs and its methods of text extraction. Part of this work is the program created in Java language, which allows text to obtain data from specific web pages and save them into XML file. | en |
dc.description.mark | A | cs |
dc.identifier.citation | TROJÁK, D. Extrakce textových dat z internetových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012. | cs |
dc.identifier.other | 56788 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/9845 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Extrakce informací | cs |
dc.subject | získání textových dat z webu | cs |
dc.subject | problémy při extrakci dat | cs |
dc.subject | wrappery | cs |
dc.subject | Java program | cs |
dc.subject | Information extraction | en |
dc.subject | text mining from Web pages | en |
dc.subject | problems with extraction data | en |
dc.subject | wrapper | en |
dc.subject | the Java program | en |
dc.title | Extrakce textových dat z internetových stránek | cs |
dc.title.alternative | Extracting text data from the webpages | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2012-06-13 | cs |
dcterms.modified | 2012-06-18-08:11:10 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 56788 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2021.11.12 17:58:00 | en |
sync.item.modts | 2021.11.12 17:41:15 | en |
thesis.discipline | Teleinformatika | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.18 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- review_56788.html
- Size:
- 3.86 KB
- Format:
- Hypertext Markup Language
- Description:
- review_56788.html