Dynamické rozpoznávání scény pro navigaci mobilního robotu

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Diplomová práce se zabývá porozuměním dynamických scén pro navigaci mobilních robotů. V první části předkládáme nový přístup k "sebe-učícím" modelům - fůzi odhadu úběžníku cesty založeného na frekvenčním zpracování a pravděpodobnostních modelech využívající barvu pro segmentaci. Detekce úběžníku cesty je založena na odhadu dominantních orientací texturního toku, získáného pomocí banky Gaborových vlnek, a hlasování. Úběžník cesty poté definuje trénovací oblast, která se využívá k samostatnému učení barevných modelů. Nakonec, oblasti tvořící cestu jsou vybrány pomocí měření Mahalanobisovi vzdálenosti. Pár pravidel řeší situace, jako jsou mohutné stíny, přepaly a rychlost adaptivity. Kromě toho celý odhad úběžníku cesty je přepracován - vlnky jsou nahrazeny aproximacemi pomocí binárních blokových funkcí, což umožňuje efektivní filtraci pomocí integrálních obrazů. Nejužší hrdlo celého algoritmu bylo samotné hlasování, proto překládáme schéma, které nejdříve provede hrubý odhad úběžníku a následně jej zpřesní, čímž dosáhneme výrazně vyšší rychlosti (až 40x), zatímco přesnost se zhorší pouze o 3-5%. V druhé části práce předkládáme vyhlazovací filtr pro prostorovo-časovou konzistentnost predikcí, která je důležitá pro vyspělé systémy. Klíčovou částí filtru je nová metrika měřící podobnost mezi třídami, která rozlišuje mnohem lépe než standardní Euclidovská vzdálenost. Tato metrika může být použita k nejrůznějším úlohám v počítačovém vidění. Vyhlazovací filtr nejdříve odhadne optický tok, aby definoval lokální okolí. Toto okolí je použito k rekurzivní filtraci založené na podobnostní metrice. Celková přesnost předkládané metody měřená na pixelech, které nemají shodné predikce mezi původními daty a vyfiltrovanými, je téměř o 18% vyšší než u původních predikcí. Ačkoliv využíváme SHIM jako zdroj původních predikcí, algoritmus může být kombinován s kterýmkoliv jiným systémem (MRF, CRF,...), který poskytne predikce ve formě pravěpodobností. Předkládaný filtr představuje první krok na cestě k úplnému usuzování.
The thesis deals with dynamic scene understanding for mobile robot navigation. In the first part, we propose a novel approach to self-supervised learning - a fusion of frequency based vanishing point estimation and probabilistically based color segmentation. Detection of a vanishing point is based on the estimation of a texture flow produced by a bank of Gabor wavelets and a voting function. Next, the vanishing point defines the training area which is used for self-supervised learning of color models. Finally, road patches are selected by measuring roadness score. A few rules deal with dark cast shadows, overexposed hightlights and adaptivity speed. In addition to that, the whole vanishing point estimation is refined - Gabor filters are approximated by Haar-like box functions, which enables efficient filtering via integral image trick. The tightest bottleneck, a voting scheme, is modified to coarse-to-fine, which provides a significant speed-up (more than 40x), while we loose only 3-5% in precision. The second part proposes a smoothing filter for spatio-temporal consistency of structured predictions, that are useful for more mature systems. The key part of the proposed smoothing filter is a new similarity metric, which is more discriminative than the standard Euclidean distance and can be used for various computer vision tasks. The smoothing filter first estimates optical flow to define a local neighborhood. This neighborhood is used for recursive averaging based on the similarity metric. The total accuracy of proposed method measured on pixels with inconsistent labels between the raw and smooth predictions is almost 18% higher than original predictions. Although we have used SHIM, the algorithm can be combined with any other system for structured predictions (MRF/CRF,...). The proposed smoothing filter represents a first step towards full inference.
Description
Citation
MIKŠÍK, O. Dynamické rozpoznávání scény pro navigaci mobilního robotu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Kybernetika, automatizace a měření
Comittee
doc. Ing. Zdeněk Němec, CSc. (předseda) doc. Ing. Petr Blaha, Ph.D. (místopředseda) doc. Ing. Ludvík Bejček, CSc. (člen) Ing. Petr Honzík, Ph.D. (člen) Ing. Ondřej Hynčica (člen)
Date of acceptance
2012-06-05
Defence
Student obhájil diplomovou práci.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO