Posudky závěrečné kvalifikační práce

Posudek vedoucího

Janáková, Ilona

Předložená diplomová práce pana Zemčíka na téma zpracování obrazových dat projíždějících vlaků za účelem detekce a rozpoznání označení jednotlivých vozidel je po formální stránce dobře upravená. Text je slohově čtivý, vyskytuje se jen minimum překlepů, upozornila bych jen na občasné chybné používání čárek před spojkou „a“ a „který“. Dokument je vhodně rozdělen do kapitol a věnuje se postupně všem jednotlivým bodům zadání. Teoretická část se zaměřuje stručně jen na metody zpracování obrazu skutečně použité v práci a dobře k tomu využívá dostupnou literaturu. Zároveň jsou dobře popsána specifika UIC kódu a samotného značení vozidel. Systém Unirail, na který diplomant navazuje, je podroben analýze z hlediska vstupních dat a úspěšnosti a problémům čtení kódu. Zmíněny jsou i konkurenční řešení. Rešerši metod, především lokalizaci a segmentaci textových polí, mohl být v práci věnován větší prostor, obzvláště když z konzultací vím, že bylo z odborných článků nastudováno a testováno více přístupů. Samotnému návrhu a implementaci zvolených postupů se věnují kapitoly 4 a 5. Tyto jsou rozepsány spíše myšlenkově, blokově. I s ohledem na spíše minimální rozsah dokumentu, mohly být detailnější, konkrétnější. Především však mělo být provedeno rozsáhlejší testování. Chybí mi vyhodnocení úspěšnosti segmentace jednotlivých vozidel. Sledována není ani úspěšnost odhadu rychlosti. Zvlášť mohla být podrobena také úspěšnost lokalizace textových polí (nejen výsledná úspěšnost čtení ovlivněná použitým OCR) a porovnány výsledky bez a s použitím navržených metod předzpracování a dopad zařazeného postprocessingu tak, aby se zdůraznil přínos jednotlivých navržených úprav řešení. Celkově si myslím, že předložený dokument bohužel „špatně prodává“ kvalitu, odbornost i časovou náročnost odvedené práce. Toto přikládám nejspíše špatnému odhadu potřebného času pro sepsání dokumentu. Student pracoval samostatně a iniciativně. Vyžadoval jen minimálně konzultací. Obzvláště v posledních fázích projektu pracoval velmi intenzivně a efektivně. Řešenému problému rozumí a prokázal během konzultací i při samotném řešení dobré odborné znalosti. Dosažená úspěšnost sice není z pochopitelných důvodů na úrovni komerčních řešení, i díky použití volného na konkrétních datech nenaučeného OCR, ale hlavní přínos práce vidím především v návrhu koncepce a v implementaci postupů pre a post-processingu navržených na základě důkladné, a vzhledem k objemu dat jistě časově náročné, analýze dat. Dalším přínosem je sestavení dosud pravděpodobně neexistující databáze možných vyskytujících se skupin číslic pro verifikaci kódů. Student také navrhl postup zpracování jen na základě obrazových dat, tedy značně zjednodušující hardware a instalaci a umožňující i jiný typ nasazení systému (např. mobilní zařízení). Vytvořený program je správně navržen. Kód je dobře strukturován a i přes jen stručný popis v dokumentu (viz výše) a minimum komentářů přímo v kódu, umožňuje jeho případné využití pro další práci. Pan Zemčík podle mého názoru prokázal svou prací inženýrské schopnosti, a proto ho doporučuji k obhajobě s hodnocením C.

Navrhovaná známka: C

Body: 70

Posudek oponenta

Richter, Miloslav

Písemná práce má rozsah 51 stran. Na množství odvedené práce by si zasloužila rozsah větší, zvláště pak v popisu vlastní práce diplomanta, který ne vždy dostatečně popisuje důvody a detaily zvoleného řešení. Formální úprava zprávy je na dobré úrovni. Textová/jazyková část je bez výraznějších chyb, které by ztěžovaly čtení a orientaci v textu. Literární zdroje týkající se řešeného problému jsou uvedeny v sekci literatura. V práci je z nich čerpáno a jsou řádně uvedeny odkazy. I když student nedosáhl vylepšení současného stavu, jeho stupeň znalosti příslušné problematiky je značný, zvolená koncepce řešení je správná. Úvodní část shrnující výchozí znalosti je převzata, zbývající část řešení problému lze pokládat za vlastní práci diplomanta. Úloha patří mezi složitější a bylo provedeno velké množství práce. Bohužel se ji nepodařilo prezentovat. Patrně čas věnovaný snaze vyrovnat se algoritmy špičkovým firmám v oboru, nebo značná rozsáhlost řešeného problému, vedla k tomu, že popis postupu řešení není kvalitní. V práci jsou tak některé části řešení pouze naznačeny bez detailnějšího popisu. Není například uvedeno, jak se konkrétně vyhledávají místa se znaky, což považuji za stěžejní část práce (v textu se hovoří o aplikaci funkce označující spojené objekty a jejich další filtrování. O konkrétním principu, použité metodě nebo typu filtru, či realizaci není zmínka). I další části řešení jsou popsány dosti vágně – např. při separaci vagonů je napsáno, že se omezí na oblast střech, ale není řečeno, jak se určí střecha, ani není vyčísleno, jaké zlepšení toto řešení přinese. Segmentace při nedostatečné detekci je popsána jednou větou – přitom je to složitější algoritmus, který by měl být popsán rozsáhleji. Na konci kapitoly 5.2.1 se píše, že je implementován modul popsaný v kapitole 4.8.1 – zde je ovšem návrh metod popsán spíše jako soubor nápadů – není z něho jasné, co se realizovalo a jak – například, které země byly zvoleny jako přípustné, aby se jejich vozy pohybovaly po ČR a které země byly vyřazeny. Obdobné otázky vyvolává stanovení a použití rychlosti vlaku. V Obr 4.1 vystupuje jako část řešení. V kapitole 4.3 je její využití popsáno teoreticky jako možnost a že je to úkol pro řešení. Realizace a výsledky nejsou popsány. Na výslednou kvalitu má vliv použitá metoda OCR. Pokud je vyhodnocení závislé na špatně naučeném OCR, mohl provést testy bez OCR a zhodnotit kvalitu lokalizace míst s pravděpodobným výskytem znaků. Také mohla být zhodnocena úspěšnost OCR na sadě kvalitních dat. V práci je menší množství vad: Mezi jednotlivými subobrázky by měly být oddělovací mezery pro lepší orientaci – obr 3.4, 4.4. Na str. 30 je špatný odkaz na obr 4.1. Dále je zde překlep v příkladu kontrolního součtu (2x2=5 a následně počítáno s hodnotou 4). Nedostatky mají i přílohy: U seznamu použitého SW měly být uvedeny jejich zdrojové www adresy v příloze (spíše než v textu) a vysvětlen význam číslic v seznamu. Na CD měla být celá databáze snímků, se kterou student pracoval. Jsou zde pouze vzorky snímků jednotlivých typů (po 10 snímcích). Program je přiložen, není zde však návod jak postupovat při jeho modifikacích (změna pracovních adresářů, názvů souborů…), není popsán formát a význam dat v konfiguračních a datových souborech. Přiložená práce svědčí o inženýrských schopnostech studenta. Navrhuji klasifikaci D

Navrhovaná známka: D

Body: 69

Otázky

(V kapitolách 5.3.X.) Co je úspěšná detekce? Jaká je vazba uvedených grafů na vývojový diagram průběhu vyhodnocení? Tj. jak je v nich zachycen „finální krok předzpracování“ a jak se uplatní na výsledku? V jakém pořadí se provádí – jak je uvedeno na str. 44 nebo v pořadí uvedeném v grafech? Provádí se samostatně nebo postupně? Jaké metody byly použity při testech a v jakém pořadí?
Byla realizována korekce rychlosti, nebo nahrazení dalších čidel? Jaká byla kvalita náhrady? (Například úspěšnost zjištění „otočení“ písmen při detekci v OCR).
Jaké jsou navrhované změny HW a jejich přínos řešení?