Visipedia - Embedding-driven Visual Feature Extraction and Learning

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Multidimenzionální indexování je účinným nástrojem pro zachycení podobností mezi objekty bez nutnosti jejich explicitní kategorizace. V posledních letech byla tato metoda hojně využívána pro anotaci objektů a tvořila významnou část publikací spojených s projektem Visipedia. Tato práce analyzuje možnosti strojového učení z multidimenzionálně indexovaných obrázků na základě jejich obrazových příznaků a přestavuje metody predikce multidimenzionálních souřadnic pro předem neznámé obrázky. Práce studuje příslušené algoritmy pro extrakci příznaků, analyzuje relevantní metody strojového účení a popisuje celý proces vývoje takového systému. Výsledný systém je pak otestován na dvou různých datasetech a provedené experimenty prezentují první výsledky pro úlohu svého druhu.
Multidimensional embedding is a powerful method of representing similarity measures among objects without the need for their explicit categorization. It has been increasingly used in recent years to annotate objects making an important part of the Visipedia project and its related work. This work explores the possibilities of learning from embedding-annotated images using their visual attributes and develops methods of predicting embedding coordinates for previously unseen images. It studies the relevant feature extraction and learning algorithms and describes the whole process of design and development of such a system using common machine learning approaches. The system is tested and evaluated with two different datasets and the performed experiments present the first results for a task of its kind.
Description
Citation
JAKEŠ, J. Visipedia - Embedding-driven Visual Feature Extraction and Learning [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2014.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Počítačová grafika a multimédia
Comittee
prof. Dr. Ing. Pavel Zemčík (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) doc. Dr. Ing. Otto Fučík (člen) prof. Ing. Adam Herout, Ph.D. (člen) Mgr. Ing. Pavel Očenášek, Ph.D. (člen) doc. Ing. Petr Sedlák, Ph.D. (člen)
Date of acceptance
2014-06-23
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "A". Otázky u obhajoby: Jakým způsobem je řešen vliv velikosti obrázku? Použití lokálních extraktorů příznaků nebo varianty s bloky povedou též na použití Visuálních Slovníků. Diskutujte. Jakým způsobem se určuje kvalita vypočteného multidimenzionálního indexu? Podle čeho se určuje nejvhodnější počet dimenzí? Co ukazují distribuce chyby na Obr. 11.3? K čemu a jak se tyto výsledky dají využít?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO