Visipedia - Multi-dimensional Object Embedding Based on Perceptual Similarity

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Problémy jako je jemnozrnná kategorizace či výpočty s využitím lidských zdrojů se v posledních letech v komunitě stávají stále populárnějšími, což dosvědčuje i značné množství publikací na tato témata. Zatímco většina těchto prací využívá "klasických'' obrazových příznaků extrahovaných počítačem, tato se zaměřuje především na percepční vlastnosti, které nemohou být snadno zachyceny počítači a vyžadují zapojení lidí do procesu sběru dat. Práce zkoumá možnosti levného a efektivního získávání percepčních podobností od uživatelů rovněž ve vztahu ke škálovatelnosti. Dále vyhodnocuje několik relevantních experimentů a představuje metody zlepšující efektivitu sběru dat. Jsou zde také shrnuty a porovnány metody učení multidimenzionálního indexování a prohledávání tohoto prostoru. Získané výsledky jsou následně užity v komplexním experimentu vyhodnoceném na datasetu obrázků jídel. Procedura začíná získáváním podobností od uživatelů, pokračuje vytvořením multidimenzionálního prostoru jídel a končí prohledáváním tohoto prostoru.
Some problems like fine-grained categorization or human-based computation has become popular in recent years in the community, which has been proven by a large number of published works concerning these topics. Whereas most of these works uses a "classical'' visual features extracted by machine, this one in particular focuses on perceptual properties which cannot be easily sampled by machine and which involves humans into this data retrieval process. There are examined ways, how to obtain perceptual similarities from humans cheaply and effectively also in terms of scalability. There are performed various experiments and purposed several methods to improve this efficiency. The work also reviews and compares existing methods of embedding learning and navigating through its space. The acquired observations are subsequently used in a complex experiment evaluated with a food image dataset, covering the whole procedure from similarity retrieval from humans, over data embedding learning up to searching in such multi-dimensional space.
Description
Citation
MATERA, T. Visipedia - Multi-dimensional Object Embedding Based on Perceptual Similarity [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2014.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Počítačová grafika a multimédia
Comittee
prof. Dr. Ing. Pavel Zemčík (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) doc. Dr. Ing. Otto Fučík (člen) prof. Ing. Adam Herout, Ph.D. (člen) Mgr. Ing. Pavel Očenášek, Ph.D. (člen) doc. Ing. Petr Sedlák, Ph.D. (člen)
Date of acceptance
2014-06-23
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "A". Otázky u obhajoby: The experiments exploring relations between embedding quality and number of triplets are done on intrinsically 2D data. Does the intrinsic data dimensionality influence  the amount of triplets needed? If so, how would different data influence the results of your experiments? Could you explicitly summarize your contribution to state-of-the-art and relate your approach on the Food-1000 dataset to approaches of other authors?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO