SLÁDEČEK, M. 3D rekonstrukce z více pohledů kamer [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2019.

Posudky

Posudek vedoucího

Richter, Miloslav

Prezentační úroveň práce je na dobré úrovni, s dobrou úpravou a na dobré jazykové úrovni. Práce je spíše rozsáhlejší, což odpovídá složitosti řešené úlohy. Jednotlivé kapitoly popisují teorii a postup řešení. Rozsah kapitol odpovídá jejich důležitosti. Během práce diplomant čerpal ze zdrojů, které si vyhledal. Z vyhledaných zdrojů vybral vhodně ty, které byly vhodné pro řešení jeho úlohy, a z nich čerpal. Jejich seznam je uveden v práci a v textu jsou na ně odkazy. Student se práci věnoval průběžně a vážnější problémy konzultoval. Zadání je možné považovat za splněné. Navazoval na své dřívější zkušenosti v dané problematice a věnoval se hlavně návrhu struktury programu, tak aby na sebe jednotlivé části navazovaly a aby bylo možné program snadno upravovat a rozšiřovat. Úpravy mu však zabraly více času, který následně chyběl pro rozsáhlejší testování výsledků. Výstupem práce je kvalitní rozbor úlohy a navržení datových struktur pro programování dané úlohy. Tato koncepce může sloužit jako zdroj pro řešení podobných úloh v budoucnosti. Výsledné řešení je využitelné v typově podobných úlohách rekonstrukce objektů.

Navrhovaná známka
B
Body
80

Posudek oponenta

Klečka, Jan

Dokument diplomové práce Bc. Martina Sládečka splňuje doporučený rozsah stran, řídí se předepsanou šablonou, obsahuje všechny požadované náležitosti jako též několik překlepů, gramatických chyb a neodborných výrazů a spojení (např. str. 32 – „Tato hodnota však uvažuje… “, str. 45 – „… datový typ, který se bude chovat jako fasáda …“, str. 48 – „zbude jediná falešná korespondence“, str. 58 – „rektifikátor“, str. 60 – „odrektifikování“), ale jejich frekvence je na přijatelné úrovni. Z formálního hlediska mám dvě připomínky. První je k citacím zdrojů. Mnoho skutečností teoretického rozboru (kap. 2) není ať už zcela nebo dostatečně citováno. Možná je to způsobeno tím, že značná část z bibliografických záznamů v sekci Literatura nemá v textu žádný odkaz (jsou to záznamy [2,3,4,11,12,15,16,17,18]). Má druhá formální připomínka je k řazení jednotlivých částí dokumentu, které je místy nelogické a znesnadňuje čtenáři pochopení. Konkrétní příklady jsou: popis použitých datasetů je zařazen až po kap. 3, v níž jsou některé datasety použity v popisu provedených experimentů a dále pak návrh stěžejního algoritmu práce je přehledně uveden až v jejím závěru. Ke zdárnému vypracování student musel nastudovat značné množství látky, která se na našem oboru vyučuje jen velmi zevrubně. Správně byla identifikována vhodná literatura a potřebné termíny. Zde bych měl výhradu k tomu, že nastudováno bylo jen opravdu nezbytné minimum. Časté nepřesnosti v popisu naznačují jen plytké pochopení termínů, s nimiž je zacházeno. Konkrétně např. str. 15 – uvedeno, že tzv. scale-space je konstruován pomocí Gaussova šumu, str. 16 – autor tvrdí, že zvýšením přípustné hodnoty chybové funkce se sníží jak počet správných, tak falešných detekcí, str. 18 – parametr r v rovnicích pro kompenzaci nelineárních zkreslení objektivu je označen jako střed obrazu, ač tradičně to bývají obrazové souřadnice středu projekce, str. 18 – o orientaci kamery v prostoru je prohlášeno, že „je udána orientací optické osy“, což ale zjevně zanedbává rotaci právě kolem této osy, str. 24 – v popisu algoritmu RANSAC je silně zobecněna motivace a algoritmus je uveden nekompletně. Dále student mnohdy používá vlastní překlady anglických termínů, namísto aby využil v českém jazyce zažitých spojení. Např. významné body jsou označovány jako klíčové body, vnitřní a vnější parametry modelu kamery jsou označovány jako intrinsické a extrinsické, model dírkové komory je označován buď jako camera obscura nebo jako pinhole camera, příznakový vektor je označován termínem deskriptor. Návrh i implementace algoritmů jsou v pořádku. Jsou patrny autorovy rozsáhlé znalosti v oblasti programovací jazyka Python, jak po stránce programátorských schopností, tak z hlediska přehledu v dostupných knihovnách. Co bych rád z návrhu vyzdvihl je datový model, který je navržen velmi robustně s rozmyslem a pochopením požadavků problému. Zbytek návrhu dosahuje průměrné kvality. V práci je popsáno několik implementačních experimentů, ale mnohdy jim chybí vhodné slovní hodnocení, proto pak není jasné, jaké závěry autor z výsledků vyvodil a jak výsledky ovlivnily řešení. V hrubých rysech je zadání DP splněno. Vznikla aplikace pro realizaci „3D rekonstrukce z více pohledů kamer“ a je ji dle mého názoru možné považovat za vlastní dílo autora. Splnění úkolů prvních dvou úkolů zadání jasně dokumentují kapitoly 1 a 2. Třetí bod zadání říká „Nasnímejte sady snímků pro testování metod rekonstrukce.“ odevzdaná práce ale obsahuje pouze jednu sadu. Navíc jde o sadu skládající se z pouhých šesti snímků pořízených fotoaparátem v mobilním telefonu. V čtvrtý bod zadání „Realizujte vhodné metody rekonstrukce a metody pro spojení 3D mraků bodů do společného celku a vytvoření výsledné 3D plochy s možností potlačení lokálních nepřesností. Zhodnoťte jejich kvalitu.“ je neméně problematický. Metody rekonstrukce realizovány byly. Metody pro spojení 3D mraků bodů a vytvoření výsledné 3D plochy s možností potlačení lokálních nepřesností nejsou ale dle mého názoru dílem autora, protože v práci jsou realizovány použitím volně dostupné aplikace Meshlab. Autorem uvedené zhodnocení kvality dosažených výsledků je povrchní založené převážně na komentování rozdílů mezi vzhledem objektu na vstupních obrázcích a vzhledem jeho rekonstrukce. Pro názornost cituji ze str. 69 „V obrázku 4.3c vypadá mrak bodů docela dobře…“. I přes uvedené výhrady práce svědčí o inženýrských schopnostech autora. Po obhájení nejasností kolem splnění zadání navrhuji známku C/70.

Navrhovaná známka
C
Body
70

Otázky

eVSKP id 119312