MARŠALA, Š. Detekce více objektů s využitím počítačového vidění [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2020.

Posudky

Posudek vedoucího

Parák, Roman

Předložená bakalářská práce se zabývá tématem Detekce více objektů s využitím počítačového vidění. Student Štěpán Maršala měl za úkol provést rešerši v oblasti současného stavu počítačového vidění, která se zaměřovala na různé aspekty počítačového vidění od historického vývoje, cez aplikaci QR kódů, umělou inteligenci až po aplikaci počítačového vidění v průmyslu. Rovněž měl za úkol provést rešerši knihovny OpenCV a její využití v zkoumané oblasti. Praktická část práce obsahuje v první fázi přehled použité techniky (2D kamera Logitech, Průmyslový robot ABB, Programovatelný logický automat, atd.) a popis komunikačního protokolu OPC UA. Prioritní část práce se zaměřuje na návrh a implementaci vlastního řešení pro zvolený typ experimentu. Experiment se skládá z návrhu různych objektů (několik tvarů/fareb), vytvoření vlastního (unikátniho) řešení pro detekci vice objektů, kalibraci kamery a průmyslového robota pomocí QR kódu, detekci více skladů pomocí různych typů QR kódů, a v neposlední řadě vytvoření OPC UA klienta pro komunikaci s řídicím systémem PLC. Student splnil všechny části bakalářské práce bez výhrad. Student ve své práci řešil jak hardwarovou, tak softwarovou část a rovněž řešil uchycení kamery, vytváření objektů, které byli tisknuté na 3D tiskárne. Student pracoval na práci samostatně. Všechny postupy konzultoval s vedoucím práce. Chválím studentovu aktivitu pri tvorbě bakalářské práce, která obnášela nadstandartní objem času a úsilí. Písemná část práce, stejně jako praktická je na velmi dobré úrovni. Předloženou práci doporučuji k obhajobě a hodnotím známkou A / výborně.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita A
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu A
Navrhovaná známka
A

Posudek oponenta

Škrabánek, Pavel

Předložená bakalářská práce popisuje návrh programu pro zpracování obrazových dat z kamery, jehož primární funkcionalitou je detekce objektů různých tvarů, barev a velikostí. Práce měla následující cíle: - zpracování přehledu aktuálního poznání v oblasti detekce objektů v průmyslových aplikacích, - zpracování rešerše knihovny OpenCV a knihoven pro strojové učeni, - navržení a implementace řídícího programu pro zpracování obrazových dat z kamery, - navržení a implementace programu pro OPC UA komunikaci, - ověření funkčnosti navrženého řešení. Student splnil všechny uvedené cíle. Rozsah a kvalita jednotlivých výstupů jsou však velmi rozdílné. Zatímco kvalita výstupů prakticky orientovaných cílů je vysoká, a nemám k ní žádné výhrady, kvalita rešerší je nízká. Rovněž v popisu vytvořeného řešení chyby některé podstatné informace. Jednotlivé výtky jsou popsány níže. V textu bakalářské práce není samostatná kapitola, která by obsahovala rešerši týkající se detekce objektů. Jisté pojednání o detekci objektů je v podkapitole 2.2, která je součásti obecné kapitoly o počítačovém vidění (v rámci této kapitoly je popsán i historický vývoj počítačového vidění, QR kódy a umělé neuronové sítě). Již z rozsahu podkapitoly 2.2 (2 strany) je patrné, že se nejedná o plnohodnotnou rešerši. Popravdě z této podkapitoly ani není jasné, co to detekce objektů je (tj. co je jejím cílem). Jediným zástupcem z mnoha existujících detekčních metod, který je v práci zmíněn, je hluboká konvoluční neuronová síť YOLO. Student přitom v praktické části využívá k detekci objektů zcela odlišný přístup (jeho řešení není založené na hlubokých neuronových sítí). Knihovně OpenCV je v práci věnována celá kapitola 3. Ani v tomto případě se však nejedná o plnohodnotnou rešerši, která by ukazovala na možnosti této knihovny. Velká část obsažených informací se týká principů metod zpracování obrazu, tj. patří spíše do kapitoly 2 nebo do samostatné kapitoly. Kapitola 4 představuje zařízení, která jsou použita v praktické částí. Tato kapitola přináší přehled technických specifikací jednotlivých zařízení. Obsahuje však řadu nadbytečných informací (např. o výrobcích). Díky tomu neúměrně narůstá celková délka práce a kapitola 4 připomíná reklamní prospekt. Celkový dojem z práce rovněž snižuje absence odborné terminologie (např. thresholding je v práci využíván k tzv. segmentaci obrazu, toto slovo se však nikde neobjevuje), její nevhodné použití (např. funkce cv2.inRange není filtr barev, ale funkce zajišťující binární segmentaci obrazu) a nepravdivá tvrzení (např. umělá inteligence není matematickou funkcí, jak je tvrzeno na str. 20 – jedná se o vědní obor). Popis navrženého řešení je součástí kapitoly 5. Podkapitoly věnující se fyzickému řešení úlohy a přepočtu souřadnic jsou napsány dobře. O něco slabší je podkapitola věnovaná detekci objektů. Student uvádí, že k úpravě binárního obrazu použil jeden Gaussovský a dva morfologické filtry. Není zde však jasně uvedeno, v jakém pořadí byly filtry aplikovány, a hlavně zde chybí jakákoliv informace o jejich nastavení a zdůvodnění volby tohoto nastavení. Dalším problematickým bodem je segmentace obrazu (thresholding). Ta je realizovaná v HSV barevném prostoru, výstup kamery je však v RGB. Tj. prvním krokem programu musí být převod z RGB do HSV, což zde není vůbec zmíněno. Drobnějším nedostatkem je neúplnost obr. 33, kde chybí lokalizace objektů (levá strana diagramu). Po formální stránce musí vytknout nedůsledné dodržování zápisu proměnných, které jsou někdy psány kurzivou a někdy normálním písmem. I přes uvedené výtky hodnotím práci známkou B. Při hodnocení jsem vzal v úvahu fakt, že rozsah prací, které plynou ze zadání bakalářské práce je enormní. Pozice studenta byla dále stižena faktem, že na bakalářském stupni neprobíhá výuka předmětů zaměřených na zpracování obrazu nebo počítačové vidění, což se projevilo v nevhodně používané terminologii.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání B
Postup a rozsah řešení, adekvátnost použitých metod C
Vlastní přínos a originalita C
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti C
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací A
Navrhovaná známka
B

Otázky

eVSKP id 124827