Nástroj pro automatické získávání informací z webu
Tool for Automatic Information Obtaning from the Web
Abstract
Bakalářská práce se zabývá vytvořením nástroje pro shromáždění kladných a záporných komentářů z jednoho předního čínského e-shopu do databáze. Ta bude následně využita pro tzv. hluboké učení umělé neuronové sítě, která má rozeznávat pozitivní a negativní význam z textu. Nástroj byl napsán v programovacím jazyce Java s využitím knihoven JSON-simple a jsoup. This bachelor thesis deals with programming of a tool for collecting positive and negative comments from one of the most popular Chinese e-shop to a database. It will be used for deep learning of an artificial neural network which should distinguish positive text from negative. Application was programmed in Java with the use of JSON-simple and jsoup libraries.
Keywords
HTML, CSS, e-shop, pavouk, Java, jsoup, JSON, HTML, CSS, e-shop, crawler, Java, jsoup, JSONLanguage
čeština (Czech)Study brunch
TeleinformatikaComposition of Committee
doc. Ing. Kamil Říha, Ph.D. (předseda) Ing. Ondřej Krajsa, Ph.D. (místopředseda) Ing. Lukáš Povoda, Ph.D. (člen) Ing. Ondřej Šmirg, Ph.D. (člen) Ing. Vlastimil Člupek, Ph.D. (člen) Ing. Ľuboš Nagy, Ph.D. (člen)Date of defence
2017-06-19Process of defence
Co by bylo nutné v programu změnit, aby mohl být použit na získávání komentářů i z jiné webové stránky, než je v práci zmíněna? Byla by taková úprava jednoduchá, nebo spíš pracná? Bude program volně dostupný pro veřejnost prostřednictvím nějakého online repozitáře jako GitHub, nebo GitLab? Když ano, pod jakou licencí?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/68167Source
POLIAK, J. Nástroj pro automatické získávání informací z webu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2017.Collections
- 2017 [398]