Algoritmy pro segmentaci webových stránek
Web Page Segmentation Algorithms

Author
Advisor
Burget, RadekReferee
Burgetová, IvanaGrade
CAltmetrics
Metadata
Show full item recordAbstract
Segmentace webových stránek je jednou z disciplín extrakce informací. Umožňuje dělit stránky na různé sémantické bloky. Diplomová práce se zabývá seznámením se samotnou segmentací a také implementací konkrétní segmentační metody. V práci jsou popsány různé příklady metod jako je VIPS, DOM PS atd. Je zde teoretický popis zvolené metody a taktéž Frameworku FitLayout, který bude o tuto metodu rozšířen. Dále je tu podrobněji popsaná implementace zvolené metody. Popis implementace je zaměřen především na popis různých problémů, které jsme museli vyřešit. Nechybí zde ani testování, které pomohlo odhalit některé nedostatky. V závěru se nachází shrnutí výsledků a možné nápady, jak by se dalo navázat na tuto práci. Segmentation of web pages is one of the disciplines of information extraction. It allows to divide the page into different semantic blocks. This thesis deals with the segmentation as such and also with the implementation of the segmentation method. In this paper, we describe various examples of methods such as VIPS, DOM PS etc. There is a theoretical description of the chosen method and also the FITLayout Framework, which will be extended by this method. The implementation of the chosen method is also described in detail. The implementation description is focused on describing the different problems we had to solve. We also describe the testing that helped to reveal some weaknesses. The conclusion is a summary of the results and possible ideas for extending this work.
Keywords
Vizuální sémantika, Java, WWW, Segmentace, Document Object Model, Framework FitLayout, Visual semantic, Java, WWW, Segmentation, Document Object Model, Framework FitLayoutLanguage
čeština (Czech)Study brunch
Informační systémyComposition of Committee
doc. Dr. Ing. Dušan Kolář (předseda) prof. Ing. Tomáš Hruška, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) doc. Ing. Jiří Rybička, Dr. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)Date of defence
2016-06-21Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm dobře C. Otázky u obhajoby: Jaké hodnoty parametrů alfa a beta byste doporučil jako optimální? Vysvětlete, proč snižováním hodnoty parametru alfa lze dosáhnout více strukturovaného výsledného stromu?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/61852Source
LAŠČÁK, T. Algoritmy pro segmentaci webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.Collections
- 2016 [190]