Porovnávání dokumentů na základě barevného schématu

Loading...
Thumbnail Image
Date
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tato práce pojednává o porovnávání webových dokumentů na základe jejich barevného schématu. Zaměřujeme se na problematiku získávání barevné schémy, pro ktorou byly navrženy dvě metody spracování dokumentu, obě využívajíci knihovnu CSSBox [1]. Dále je také představen návrh normalizace dokumentu, která získavání barevného schématu předchází. Její hlavním cílem je identifikovat a zjednotit možný promněnlivý obsah zkoumaného dokumentu, aby neovlivňoval výsledky nežádoucím spůsobem. Řeší se také implementace těchto navrhovaných postupů do knihovny, která byla v závěru práce testována na vzorové sade webových dokumentů.
This paper proposes the method of web document comparison based on the color scheme. It focuses on issues of color scheme retrieving. There are suggested two methods that are using CSSBox library [1]. Also, a suggestion for a document normalization is introduced. Its main goal is to identify and unite possible dynamic content of given document which could negatively affect results of retrieving. Suggested procedures are implemented in the library. It was tested on a set of web documents.
Description
Citation
DUCHOŇ, M. Porovnávání dokumentů na základě barevného schématu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. Zdeněk Kotásek, CSc. (místopředseda) Ing. Vítězslav Beran, Ph.D. (člen) doc. Ing. Radek Burget, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen)
Date of acceptance
2012-06-11
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B (velmi dobře). Otázky u obhajoby: V kapitole Normalizace dokumentu popisujete metodu, která do značné míry využívá značek jazyka HTML5. V jakém procentu dokumentů z testovací množiny byly tyto značky využity? Jak ovlivní výsledek normalizace, pokud tyto značky nejsou použity?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO