BITARA, M. Srovnání heuristických a konvenčních statistických metod v data miningu [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2019.

Posudky

Posudek vedoucího

Bednář, Josef

Práce se zabývá srovnáním heuristických a konvenčních metod v klasifikačních problémech. Tudíž student musel porozumět a implementovat větší množství klasifikačních metod, z nichž vybral ty nejvhodnější a ty srovnával dle různých kritérií. Student čerpal z většího množství především anglickojazyčných zdrojů a tyto metody zdařile implementoval v software Python. Jako vedoucí diplomové práce bych vyzdvihnul především samostatnost, programátorskou zručnost a znalost řešené problematiky.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod B
Vlastní přínos a originalita B
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu A
Navrhovaná známka
A

Posudek oponenta

Žák, Libor

Diplomová práce bak. Bitary je z oblasti data miningu a zvláště se zabývá srovnáním heuristických a konvenčních statistických metod při klasifikaci. Práce se skládá z pěti hlavních částí. V prvních kapitola se týká konvenčních statistických metod. Zde se student soustřeďuje pouze na logistickou regresi a to pouze na variantu, kdy vycházíme z polynomiální regrese 1. řádu. Zde by bylo vhodné doplnit další statistické modely – např. logistickou regresi vycházející z obecnějšího modelu, shlukovou analýzu. Další tři kapitoly se týkají heuristických metod. Zde jsou podrobně popsány rozhodovací stromy a náhodné lesy včetně ladění a testování. Důraz je kladen na vhodné nastavení parametrů procesů a také na ohodnocení úspěšnosti klasifikace. Hlavní přínos studenta je kapitola pátá, kde na reálných datech porovnával přístupy a metody popsané v předcházejících kapitolách. Vzhledem k různým parametrům modelů a různým modifikacím dat zde bylo odladěno a otestováno velké množství variant metod. Je zde také uvedeno srovnání úspěšnosti metod pomocí vhodných kritérií. V závěru mi chybí obecnější srovnání heuristických a konvenčních statistických metod. Diplomová práce je pěkně vypracovaná, jak po obsahové, tak i po stylistické stránce. Až na pár výjimek (např. obr. 24) je zde snaha o co největší názornost a přehled používaných metod. Diplomovou práci bakaláře Bitara doporučuji k obhajobě a hodnotím stupněm B.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání B
Postup a rozsah řešení, adekvátnost použitých metod B
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti B
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací A
Navrhovaná známka
B

Otázky

eVSKP id 117615