PEŠKA, J. Detekce cesty pomocí dat z kamery pohyblivého robotu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.

Posudky

Posudek vedoucího

Petyovský, Petr

Zadání bakalářské práce studenta Jaroslava Pešky patřilo mezi odborně obtížné. Student si zvolil studijně rozsáhlé téma analýzy obrazu a její použití v praktické realizaci detekce cesty pro mobilního robota, požadující od něj další samostudium nad rámec bakalářského studijního programu. Cílem práce bylo navrhnout algoritmy pro zpracování obrazu z několika kamer umístěných na robotickém podvozku, pomocí kterých bude robot detekovat cestu pro svůj další pohyb. V průběhu řešení práce byl jasně patrný studentův zájem o danou problematiku. Pracoval iniciativně, samostatně, účelně, avšak možností konzultací využíval spíše v omezené míře. Všechny body zadání byly splněny. Na základě nastudovaných znalostí student definoval limitní parametry úlohy, zvolil vhodný kombinovaný detektor obrazu, kterým se stala multispektrální kamera obsahující tři snímače ve viditelné části spektra a dva snímače pro infračervenou oblast spektra. Pořídil testovací sadu snímků, kterou ručně doplnil o anotované informace o skutečném umístění cesty ve snímcích z jednotlivých kamer. Následně student navrhl základní koncepci algoritmů pro detekci cesty. Zvolil základní detektory využívající neuronových sítí. S ohledem na omezený výpočetní výkon počítače, který byl umístěný na mobilní platformě, věnoval během praktické realizace velké množství času výpočetním optimalizacím detekčních algoritmů. Proto je pravděpodobně menší část textu věnována podrobnému zhodnocení všech výsledků práce. Student věnoval řešení práce dostatek času, jednotlivé úkoly si vhodně rozvrhl, a proto se v závěru nedostal do časové tísně. Dosažené výsledky i formální zpracování práce jednoznačně svědčí o bakalářských schopnostech studenta. Předložené práci navrhuji hodnocení: velmi dobře – B (88).

Navrhovaná známka
B
Body
88

Posudek oponenta

Horák, Karel

Pan Jaroslav Peška řešil ve své bakalářské práci detekci cesty ze snímku kamery ve venkovním prostředí pro jízdu soutěžního robota. Jednotlivé části práce jsou zpracovány poměrně detailně, někdy však ne přehledně. Formálně má práce vynikající úroveň, dobře se čte a neobsahuje skoro žádné gramatické chyby. Na str. 29 je uvedeno, že množina trénovacích dat je rozdělena na trénovací a testovací množinu, což je nesmysl, ale jde pravděpodobně o nepozornost, než o neznalost. Chci ale vytknout několik věcných a odborných chyb: v kapitole 2.3.3 jsou stanoveny dva zásadní parametry chodu algoritmu pro detekci cesty ve snímku (max. vzdálenost jízdy robota 0.5 m bez reakce na pořízená data a čas 200 ms pro zpracování snímku). Nikde ale není uvedeno, jakým způsobem se k těmto číslům došlo. Navržená architektura algoritmu ilustrovaná kromě textu i vývojovým diagramem na str. 30 není pro čtenáře příliš zřejmá - v blokovém schématu jsou uvedeny velmi obecné prvky jako např. “rozdělení vstupních dat” či “neuronová síť”, pod kterými si lze těžko představit konkrétní vstupy, jejich funkci a příslušné výstupy. Na str. 33 je odkázáno na obr. 3.1 s tím, že cesta je na infračerveném snímku velmi dobře viditelná a rozlišitelná od okolní trávy, narozdíl od snímku ve viditelném spektru, nicméně v papírovém výtisku nelze na uvedeném snímku cestu rozpoznat ani okem, snímek je téměř sytě černý. Další výtka se týká nedostatečného popisu volby a implementace neuronové sítě. V textu jsou míchány termíny týkající se klasických neuronových sítí a konvolučních neuronových sítí a velmi dlouho (do str. 44) ani není patrno, kterou student pro implementaci využil. Poslední věcná poznámka směruje k tzv. sekcím, což jsou části obrazu, které algoritmus zpracovává kvůli výpočetním nárokům odděleně. Počty, rozdělení a vůbec práce se sekcemi je nejvíce matoucí částí dokumentu - na začátku praktické části (str. 30) se mluví o 32x24 sekcích po 10x10 pixelech, což neodpovídá deklarovaným rozměrům obrazu 640x480 na str. 22. Na str. 45 je uvedený obrázek červenými čarami rozdělen do 4x4 sekcí po evidentně několika desítkách pixelů v jednom směru na sekci a nedaleko na str. 50 se zase píše o 4x3 sekcích po 8x8 pixelů. Naopak velmi kladně hodnotím práci se softwarem, analýzu knihoven TensorFlow, Caffe a Dlib, implementace vícevláknové aplikace, optimalizace na GPGPU apod. Tato část evidentně zabrala mnoho času. Práci lze shrnout jako odborně velmi náročnou, přesto zpracování zejména praktické části mělo být výrazně důslednější. V závěru se píše o úspěšnosti algoritmu 88%, což je dřív definováno jako pixelová shoda (bod po bodu) mezi vyhodnocovaným snímkem a ručně anotovaným. Hodnota není na první pohled vůbec špatná, nicméně pro rozhodnutí o správném výběru řešení lze v tomto případě rozhodnout až po testování v reálném prostředí s řízením robota podle výsledků algoritmu.

Navrhovaná známka
C
Body
75

Otázky

eVSKP id 111124