MALÁSEK, J. Vliv selekce příznaků metodou HFS na shlukovou analýzu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.

Posudky

Posudek vedoucího

Honzík, Petr

Student Bc. Jan Malásek řešil diplomovou práci na téma „Vliv selekce příznaků metodou HFS na shlukovou analýzu“ prakticky samostatně, emailové konzultace využil několikrát za účelem vyjasnění fungování metody HFS, s dotazem se minimálně jednou obrátil též na autora metody s pozitivní odezvou. Z průběhu konzultací bylo patrné, že problematice se student věnuje s dostatečným předstihem, aby bylo v jeho silách zadání zdárně dokončit. Výsledky ani závěrečná práce ke konzultaci předloženy nebyly. Z pohledu přístupu k řešení zadání hodnotím studenta známkou B, velmi dobře, 85 bodů.

Navrhovaná známka
B
Body
85

Posudek oponenta

Klusáček, Jan

Zadání práce lze hodnotit jako středně obtížné po odborné i časové stránce. Po formální stránce obsahuje práce několik nedostatků. Celá práce je bez úvodu a závěru rozdělena jen do tří kapitol a obsah kapitol tak nemůže přesně odpovídat jejich názvu. Například první kapitola nazvaná "Principy shlukové analýzy" popisuje kromě cílů a principů shlukové analýzy, také problematiku určení optimálního počtu hledaných shluků a metody používané pro selekci příznaků. Splnění jednotlivých bodů zadání hodnotím následovně: Bod 1: Splněn Popis metod pro shlukovou analýzu je součástí první kapitoly a je na dobré úrovni. Na této části práce oceňuji práci s literaturou, na kterou autor v popisu metod často odkazuje. Bod 2: Splněn Úspěšnost jednotlivých metod výběru příznaků byla otestována za použítí prostředí Matlab a knihovny Statistic and Machine Learning Tolbox. Pro testování bylo vybráno několik datových souboru z repozitáře UCI a pro jeden z datových souborů použil reálná data získaná na vibračním přípravku zhotoveném v rámci jiné diplomové práce, bohužel však v práci není popsáno jak byly z naměřených dat vytvořeny jednotlivé atributy. Zároveň s testováním metod výběru atributů na základních datových souborech byly metody testovány i na souborech vzniklých použitím metody HFS(Hybrid feature selection), některé připomínky jsou tedy uvedeny v bodě 5. Bod 3: Splněn Popis jednotlivých metod je s vyjímkou metody HFS stručný (dle zadaní). Autor u jednotlivých metod opět dobře odkazuje na literaturu, takže v případě potřeby není problém zjistit podrobnosti o metodách. Bod 4: Splněn Metoda HFS byla popsána dostatečně podrobně, včetně dvou různých možností výpočtu relevance atributů. Problematické jsou však některé obrázky převzaté z článku popisujícího HFS. Uvedený vývojový diagram HFS (obr. 2.10 str. 28) neodpovídá popisu algoritmu a obrázky 2.12 a 2.13 mají pravděpodobně prohozené popisky. Popisovaná metoda byla implementována v prostředí Matlab. Bod 5: Splněn Přínos metody byl ověřen srovnáním výsledků shlukové analýzy na původních datových souborech a na datových souborech po použití metody HFS (bod 3). Výsledky těchto experimentů jsou uvedeny v tabulkách, které dobře dokumentují celý experiment, množství tabulek přímo v textu je však velké a z hlediska přehlednosti by bylo vhodnější některé tabulky přesunout do přílohy. Dlouhé tabulky také způsobují některé problémy s formátováním práce (například str. 67, 65). Závěrečné zhodnocení přínosu metody HFS je poměrně stručné a jeho zpracování by mohlo být přehlednější. Například v tab. 4.47 (str. 98) by bylo vhodné zvýraznit které sloupce obsahují lepší výsledek (stejným stylem který byl použit ve většině tabulek). V grafu 4.6 by bylo vhodné umístit odpovídající si sloupce vedle sebe aby bylo možné je lépe porovnat. I v dalších grafech je možné najít určité nedostatky. Například v obr 4.25 chybí popisy os a není tedy jasné které atributy jsou vlastně použity. Vlastní závěr práce je dlouhý, ale z větší části obsahuje hlavně popis obsahu jednotlivých kapitol. Závěry z provedených experimentů jsou tu opět velmi stručné. Přes výše uvedené problémy odvedl student velké množství kvalitní práce a většina nedostatků spočívá až ve zpracování textové zprávy. Práci považuji za důkaz inženýrských schopností studenta a doporučuji ji k obhajobě s hodnocením "C/"

Navrhovaná známka
C
Body
73

Otázky

eVSKP id 85118