Posudky závěrečné kvalifikační práce

Posudek vedoucího

Kolář, Radim

Veronika Hříbková se v diplomové práci zabývala studiem metod pro 3D rekonstrukci hlavy a jejího geometrického modelu pomocí stereoskopického snímání. Diplomantka si během semestru nastudovala netriviální problematiku související s matematickým popisem snímání scény pomocí kamery, problematiku epipolární geometrie a stereo-rekonstrukce. Prakticky pak realizovala postup kalibrace kamer, rektifikaci obrazů, vytvoření disparitní mapy a finálního modelu včetně trackování během pohybu hlavy. Na závěr ověřila funkčnost realizované metodiky a řadě nasnímaných sekvencí. Nad rámec zadání také navrhla jednoduchý způsob kvantitativního vyhodnocení. Studentka pracovala po celou dobu semestru aktivně, samostatně a konzultovala výjimečně, pouze otázky související s vyhodnocením výsledků a dalším postupem. Odevzdaný text považuji za kvalitní, jak po formální, tak obsahové stránce.

Navrhovaná známka: A

Body: 95

Posudek oponenta

Jakubíček, Roman

Cílem diplomové práce je navrhnout a implementovat algoritmus pro určení polohy hlavy ze stereoskopických snímků. Řešení tohoto úkolu se skládá ze dvou základních kroků: návrh a realizace stereoskopického systému a za druhé navrhnout a implementovat postupy vhodné pro modelování polohy hlavy na základě detekce význačných bodů. Jak studentka uvádí v závěru práce, tato druhá část je i jejím hlavním cílem. Na základě toho mám některé výtky právě k členění teoretické části a popisu navržené metodiky. K první části práce směřující k návrhu stereoskopického systému, studentka uvádí podrobný a přehledný teoretický rozbor zabývající se geometrií kamery, vznikem a možnostmi korekce geometrických zkreslení a v další kapitole uvádí nezbytný teoretický úvod ke stereorekonstrukci. K této části mám několik drobných výtek, např. chybně uvedená rovnice poloměru v textu nad vztahem 1.18., dle citovaného zdroje [3] studentka zaměňuje poloměr r s vlnovkou a bez nebo rovnice 1.19 odkazovaná na citaci [5], není v tomto článku nikde uvedena. V následné realizaci stereoskopického systému studentka uvádí postup kalibrace pomocí kalibrační šablony s využitím aplikace Stereo Camera Calibrator a knihoven v Matlabu. Pomocí dalších nástrojů, které jsou součástí knihoven Matlabu je provedena rektifikace a následně vytvořena disparitní mapa metodou Semi-Global Block Matching, jejíž popis v teoretickém rozboru zcela chybí. Druhá část se zabývá návrhem a implementací algoritmů umožňující detekci význačných bodů obličeje a následný odhad polohy hlavy. Zde studentka vhodně navrhla metodiku využívající několik pokročilých metod zpracování obrazů. Z textu jasně nevyplývá přínos studentky, zda je navržený přístup inspirován publikovaným algoritmem a do jaké míry a případně v kterých krocích. Popis návrhu má logickou strukturu, nicméně v některých částech je příliš podrobný až matoucí. Zde by bylo vhodné uvést blokové schéma navrženého systému umožňující větší nadhled nad jeho koncepcí a zpřehlednit popis dílčích kroků. Jako závažný nedostatek práce považuji absenci teoretického základu většiny použitých metod zpracování obrazů, které jsou uvedeny vždy jen jako použitý algoritmus, i když s řádnou citací (např. detekční algoritmus Vioala-Jones využívající Haarovy příznaky a klasifikační algoritmus AdaBoost, dále detektor význačných bodů založený na „Minimum Eigenvalue algorithm“, Wienerův filtr, Cannyho detektor či metoda optického toku Canade-Lucas-Tomasi pro finální trasování). Myslím si, že základní teorie těchto zmíněných algoritmů by bezpochyby měla být uvedena v teoretické části práce, kde zcela chybí. Výsledky detekce jsou shrnuty do jedné tabulky, která uvádí výsledky detekce jednotlivých význačných bodů na databázi snímků 11 figurantů. Statistika je založena na porovnání s manuálně určenými význačnými body bez bližších informací expertního značení. Zavedené kritérium „Přesná detekce“ určující procento správně detekovaných bodů se vzdálenostní chybou menší než stanovený „toleranční práh“, je dle mého názoru nejednoznačné, zejména vzhledem k tomu, že stanovení těchto konkrétních hodnot prahů není nijak odůvodněno. Názornější by byl právě graf závislosti této přesnosti detekce na zvoleném prahu. Dále není vysvětlena nulová hodnota průměrné chyby pro kategorii „Koutky úst“, kde je stanoven „toleranční práh“ na 6px. Pokud byla počítána tato chyba pouze z nadprahových hodnot, což by vysvětlilo tento fakt, tak poté u detekce zorniček nemůže průměrná chyba nabývat hodnoty menší než stanovený toleranční práh 3px. Navíc není nikde definováno uváděné hodnotící kritérium „Prům. chyba“. Nevím, proč studentka neuvádí úspěšnosti prvotních částí algoritmu, kterým v práci věnuje nemalou část (např. rektifikace obrazů nebo úpravy disparitní mapy, které bezesporu mají vliv na úspěšnost algoritmu). Chybí mi statistické vyhodnocení výsledků algoritmu při ztížených podmínkách, které jsou v práci uváděny. Na základě předložené práce lze usoudit, že studentka se v dané problematice orientuje, vhodně zvolila a realizovala algoritmy k dosažení hlavních cílů, a tím splnila všechny body zadání. Závěrem lze konstatovat, že i přes výše zmíněné výtky je práce na dobré odborné i formální úrovni a proto práci doporučuji k obhajobě se stupněm hodnocení – C 75.

Navrhovaná známka: C

Body: 75

Otázky

Máte představu, jak by se dal řešit problém se segmentací obličeje pomocí prahování Otsu metodou za ztížených podmínek uváděný na obrázku 6.5?