PAUKEJE, J. Analýza a modelování provozu v datových sítích [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012.

Posudky

Posudek vedoucího

Růčka, Lukáš

Zadáním práce bylo prozkoumat matematické modely využívající zpracování dat ve formě časové řady pro analýzu a modelování síťového provozu, zachytit dlouhodobý záznam provozu a navrhnout atomatizovatelnou metodu odvození či odhadu parametrů pro matematický popis. Zadání práce je splněno jen částečně. Teoretický rozbor je ucelený, chybí především studentův přínos a praktické výstupy. Během řešení diplomové práce student nekonzultoval a neinformoval o pokrocích v práci (údajně z důvodu rodinných problémů). Text práce jsem viděl poprvé až po odevzdání. Rozsah práce je na dolní hranici požadovaným pro DP. Praktická část práce jsou strany 34 až 39 a několik skriptů v prostředí MATLAB. Student provedl teoretický rozbor dané problematiky a získal dlouhodobý záznam provozu protokolu HTTP. V praktické části se pokusil o nastínění a realizaci automatizované metody odvození parametrů pro matematický popis zachyceného provozu pomocí modelu ARIMA/GARCH. Avšak studentem představený postup produkuje zcela nepoužitelné výsledky. Student nedostatečně diskutuje proč tomu tak je. Po formální stránce je práce na průměrné úrovni. Navrhuji hodnocení F/46 bodů.

Navrhovaná známka
F
Body
46

Posudek oponenta

Novotný, Vít

Diplomant Bc. Ján Paukeje se ve své práci zabývá problematikou modelování datových toků. Tato problematika je pro studenty naší fakulty, kde je výuka zaměřena především na oblasti aplikací vědeckých poznatků, velmi komplikovaná. I když se jedná o zajímavou problematiku z oblasti statistiky orientované na datový provoz v komunikačních sítích, nezíská student naší fakulty během předchozího studia potřebné matematické základy. Proto považuji toto téma práce za značně obtížné. K práci mám následující připomínky: Diplomant v horní části stránky 10 definuje časové teoretické statistické parametry a v dolní polovině pak definuje empirické parametry, které však nepočítá v čase, ale pro jednu realizaci procesu napříč celou časovou osou, tj. tyto dvě skupiny charakteristik jsou neporovnatelné. K tomuto pochybení došlo při čerpání z literatury [7], kdy student vynechal podstatnou informaci a to, že ta druhá část platí pro stacionární, a především ergodické procesy, kdy z jedné realizace procesu lze odvozovat charakteristiky. Tuto podmínku později v textu uvádí, ale bohužel až po uvedených vztazích. V kapitole 6 je nepochopitelně použit operátor „nabla“ ve smyslu diference, kdy je vžité použití velkého řeckého písmene „delta“. Jinak je teoretická část plná matematických vztahů a i pro vysokoškolsky vzdělaného člověka, jehož oborem nebyla přímo statistika či modelování stochastických systémů nebo matematické inženýrství, je tato část bez dodatečného studia další literatury obtížně vstřebatelná. Je otázkou, zda diplomant za dobu zpracování své diplomové práce dokázal proniknout dostatečně do detailů popisovaných matematických nástrojů. Mám jisté pochybnosti, a to z důvodu úrovně zpracování praktické části. Praktická část je ve srovnání s teoretickou částí podstatně stručnější, což přikládám tomu, že se diplomant většinu času „pral“ s komplikovanou matematikou pro statistický popis náhodných procesů, a nezbyl mu čas na provedení více měření, které by pak mohl hodnotit v delším časovém úseku, měřit více realizací procesu a vypozorovat vývoj parametrů hledaného modelu jako jsou třeba vývoj počtu webových přístupů (nebo objemu přenesených dat) za jeden den nebo jenom během určitého úseku dne, například, kdy je provoz největší, a to v rámci delšího časového úseku – týden, měsíc či rok. Výstupem tak je sice požadovaný dvoudenní záznam síťového provozu webového serveru, ale již neposkytuje požadovaný model, který by mohl sloužit k predikci vývoje provozu v blízké budoucnosti. Těžko pochopitelné je uvedení vývojového diagramu předzpracování dat a neuvedení diagramu popisující postup pro hledání modelu a jeho parametrů. Dále předpokládám, že titulek obrázku 6 je chybný, protože se shoduje s titulkem obrázku 5. Podobně je tomu u obrázků 8 a 9. Rozsah práce je vzhledem k jednotkovému řádkování akceptovatelná, formální stránka zpracování práce je ucházející. Závěrem lze říci, že zadání bylo splněno pouze z části, i když neúspěch nalezení modelu je zdůvodňován, ale stačilo změnit pohled na naměřené hodnoty a zhlédnout jasnou podobnost mezi dny a toho využít pro sestavení modelu, jak již to bylo naznačeno výše. Z tohoto důvodu navrhuji hodnocení E/54

Navrhovaná známka
E
Body
54

Otázky

eVSKP id 52064