MIKULÍN, O. Implementace RapidMineru na výpočetním GRIDu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2010.

Posudky

Posudek vedoucího

Honzík, Petr

Úkolem studenta Ondřeje Mikulína bylo vytvořit aplikaci, která umožní paralelizaci modelování v programu RapidMiner pomocí výpočetního GRIDu. Jako rozhraní pro komunikaci v GRIDu měl být využit program Alchemi. Student se svou prací podílel na řešení projektu FRVŠ, který končil na konci roku 2009. Většina práce tak byla dokončena již v prvním semestru. Ve druhém semestru měl student rozšířit a upravit první verzi programu. V této fázi již komunikace a práce studenta mírně vázla. Odevzdané softwarové řešení však plně odpovídá původnímu zadání, hodnotím je 90 body, známka A, výborně.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění zadání A 47/50
Formální zpracování práce A 18/20
Využití literatury A 10/10
Aktivita během řešení a zpracování práce (práce s literaturou, využívání konzultací, atd.) C 15/20
Navrhovaná známka
A
Body
90

Posudek oponenta

Kučera, Pavel

Student se v bakalářské práci zabýval vytvořením programu, který umožní distribuci výpočtů na více stanic spojených do výpočetního GRIDu. Po zevrubném prostudování práce mohu konstatovat, že zadání bylo student zcela splněno a jím vytvořená aplikace RapidParallel umožňuje distribuovat úlohy vytvořené pomocí aplikace RapidMiner do výpočetního GRIDu Alchemi. Bohužel kvalita dokumentace k tomuto SW počinu je v nesouladu s kvalitou odvedené práce. Například v popisu výpočetního GRIDu Alchemi (kap. 2.1) autor jednotlivé druhy aplikací, které je možné na tomto GRIDu provozovat (Thread a Job), popisuje pouze ve dvou odstavcích textu, ze kterých není zřejmá podstata jejich činnosti. Ta je přitom esenciální podstatou činnosti tohoto výpočetního GRIDu a má zásadní vliv na tvorbu GRIDové aplikace. V téže kapitole správně cituje a vysvětluje Fosterovu metodologii při tvorbě paralelního algoritmu, ale ve své práci se jí nedrží. Následující kapitola 2.2 se bez jakéhokoliv předchozího vysvětlení nebo úvodu zabývá obecným popisem neuronových sítí a pro čtenáře je tudíž velkým překvapením. Až později se čtenář dozví, že problém, který v aplikaci RapidParallel distribuuje je hledání optimálního tvaru a parametrů neuronové sítě. Kapitola samotná by šla rozhodně napsat lépe s ohledem na cíle této práce. Není v ní třeba vůbec zmínka o možných parametrech sítě a jak tyto ovlivňují výpočetní složitost - a to je přitom pro celou aplikaci zcela zásadní. Namísto toho jsou v ní uvedeny vztahy 1 a 2, u nichž autor neosvětluje veličiny y a d. V kapitole 3.2.1 autor popisuje způsob rozdělení parametrů na jednotlivé výpočetní stanice. Přístup BFSO je popsán poměrně srozumitelně, přesto je škoda, že autor neuvedl jednoduchý příklad, na kterém by algoritmus ukázal. Problematické je však kvalitativní hodnocení tohoto algoritmu, které podle autora vede k relativně rovnoměrnému zatížení jednotlivých výpočetních stanic. Kéž by tomu tak bylo, protože následující algoritmus DDS jasně ukazuje, že to lze udělat několikanásobně lépe. Bohužel autorův popis algoritmu DDS je mírně řečeno nedostatečný. Nejenže čtenáři chybí jakákoliv informace o tom, co je a co není schopen RapidMiner načíst jako vstupní parametry, ale v odstavci na straně 23 postupně operuje s pojmy: prostor parametrů, prvky stejných vlastností, shluky, útvary a homogennější bloky dat, aniž by je čtenáři vysvětlil. Ani po několikerém přečtení jsem nebyl schopen zrekonstruovat autorovu myšlenku a bez nahlédnutí do zdrojových textů bych toho nebyl schopen vůbec. Z formálního pohledu obsahuje práce několik překlepů a stylistických nedokonalostí, zejména v podobě přechodu od trpného do činného rodu apod. Nicméně si dovoluji studenta upozornit, že pokud přebírá do své práce práci někoho jiného, je nutné citovat původní zdroj a nikoliv prostředníka - hovořím o obrázku 2.3. Student vytvořil v souladu se zadáním kvalitní aplikaci, kterou ale popsal nevhodným způsobem. Častým vynecháváním myšlenkových pochodů, neschopností jasně se vyjádřit při popisu některých problémů a neuvedením celé řady souvisejících informací autor práci zcela zbytečně deklasoval a proto ji hodnotím stupněm C.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků zadání A 20/20
Odborná úroveň práce D 30/50
Interpretace výsledků a jejich diskuse A 20/20
Formální zpracování práce E 5/10
Navrhovaná známka
C
Body
75

Otázky

eVSKP id 30837