AdaBoost v počítačovém vidění

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
V této diplomové práci jsou představeny nové obrazové příznaky "local rank differences" (LRD). Tyto příznaky jsou invariantní vůči změnám osvětlení a jsou vhodné k implementaci detektorů objektů v programovatelném hardwaru, jako je například FPGA. Chování klasifikátorů s LRD vytvořených pomocí algoritmu AdaBoost bylo otestováno na datové sadě pro detekci obličejů. LRD v těchto testech dosáhly výsledků srovnatelných s výsledky klasifikátorů s Haarovými příznaky, které jsou používány v nejlepších současných detektorech objektů pracujících v reálném čase. Tyto výsledky ve spojení s faktem, že LRD je možné v FPGA vyhodnocovat několikanásobně rychleji než Haarovy příznaky, naznačují, že by LRD příznaky mohly být řešením pro budoucí detekci objektů v hardwaru. V této práci také prezentujeme nástroj pro experimenty s algoritmy strojového učení typu boosting, který je speciálně uzpůsoben oblasti počítačového vidění, je velmi flexibilní, a přitom poskytuje vysokou efektivitu učení a možnost budoucí paralelizace výpočtů. Tento nástroj je dostupný jako open source software a my doufáme, že ostatním ulehčí vývoj nových algoritmů a příznaků.
In this thesis, we present the local rank differences (LRD). These novel image features are invariant to lighting changes and are suitable for object detection in programmable hardware, such as FPGA. The performance of AdaBoost classifiers with the LRD was tested on a face detection dataset with results which are similar to the Haar-like features which are the state of the art in real-time object detection. These results together with the fact that the LRD are evaluated much faster in FPGA then the Haar-like features are very encouraging and suggest that the LRD may be a solution for future hardware object detectors. We also present a framework for experiments with boosting methods in computer vision. This framework is very flexible and, at the same time, offers high learning performance and a possibility for future parallelization. The framework is available as open source software and we hope that it will simplify work for other researchers.
Description
Citation
HRADIŠ, M. AdaBoost v počítačovém vidění [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Počítačová grafika a multimédia
Comittee
Date of acceptance
Defence
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO