Nové metody segmentace webových stránek

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cílem této práce je představit novou metodu segmentace webových stránek založenou na analýze vizuálních vlastností webových dokumentů. Metoda vychází z velmi populárního segmentačního algoritmu VIPS (Vision Based Page Segmentation Algorithm), který se snaží na segmentovaný dokument nahlížet stejně, jako ho ve výsledku vidí jeho uživatel, tedy prostřednictvím vizuální reprezentace v internetovém prohlížeči. Oproti algoritmu VIPS jsou však u metody představené v této práci brány v úvahu optimalizace pro moderní webové stránky, především poté pro dokumenty vytvořené v jazyce HTML verze 5. Práce se rovněž zabývá implementací navržené metody pomocí rámce FITLayout.
The aim of this work is to introduce a new vision based web page segmentation method. This method is based on very popular VIPS segmentation algorithm, which is trying to represent the segmented web document in the same way as it is perceived by a user using a web browser. Compared to the VIPS algorithm, there are some optimizations for modern websites in our method, especially for documents created in the HTML 5 language. We also deal with the implementaion of the proposed method using the FITLayout framework.
Description
Citation
MALANÍK, M. Nové metody segmentace webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační systémy
Comittee
doc. Dr. Ing. Dušan Kolář (předseda) prof. Ing. Tomáš Hruška, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen) doc. Ing. Jiří Rybička, Dr. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)
Date of acceptance
2016-06-21
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně A. Otázky u obhajoby: Charakterizujte stránky, pro které váš segmentační algoritmus nepracuje zcela správně a případná řešení těchto problémů. 
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO