Posudky závěrečné kvalifikační práce

Posudek vedoucího

Macho, Tomáš

Diplomant pan Bc. Jiří Kozlovský se ve své diplomové práci zabýval optimalizací čtení dat z distribuované databáze. Jedná se o problematiku, se kterou se diplomant setkal při studiu velmi okrajově. Danou problematiku musel tedy celou nastudovat z literatury, především z Internetových zdrojů, které si samostatně vyhledával. Diplomová práce pana Kozlovského je členěna do 12 kapitol a obsahuje cca 60 stran vlastního textu. Bohužel práce je zpracována poměrně nedbale a nepřehledně, těžko se v ní orientuje a je na ní znát, že ji diplomant psal v posledních dnech před odevzdáním. Diplomová práce navazovala na předcházející semestrální práci. Diplomant se v dané problematice dokázal výborně zorientovat, už na začátku disponoval výbornými znalostmi z oblasti NoSQL databází, webových aplikací a programování v jazyce Java. Dokázal komunikovat s vývojovými týmy ve firmě Seznam.cz, kde pracuje. Vlastnímu řešení problému (návrhu optimalizace čtení z distribuovaných databází a softwarové implementaci) věnoval značné množství času a úsilí. Vedoucího informoval o postupu prací. Podařilo se mu vytvořit funkční řešení pro zrychlení získávání statistik z reklamních kampaní, které najde ve firmě Seznam.cz praktické využití. Bohužel svou práci značně degradoval nedbalým zpracováním textu diplomové práce. Jako vedoucí navrhuji hodnotit práci pana Bc. Jiřího Kozlovského známkou C/70 bodů.

Navrhovaná známka: C

Body: 70

Posudek oponenta

Holek, Radovan

Bc. Jiří Kozlovský vypracoval diplomovou práci na téma "Optimalizace čtení dat z distribuované databáze". Po stránce odborné i časové se jedná o náročné zadání. Student se musel seznámit s NoSQL databází HBase, s existující aplikací reklamního systému Sklik.cz, kterou je třeba doplnit o novou funkcionalitu dle zadání. Text diplomové práce je rozdělen do celkem jedenácti kapitol. V kapitolách 1. až 4. jsou uvedeny základní pojmy, se kterými se bude dále v práci pracovat. Tyto kapitoly jsou převzaté z citovaných zdrojů. Rozsah těchto kapitol je 25 stran. Pátá kapitola - Čtení statistických dat popisuje část informačního systému "Sklik.cz", architekturu použitých komponent a schémata pro komunikaci mezi "frontend" a "backend" komponentami. Tato kapitola je popsaná stručně a obsahuje řadu klíčových slov a pojmů, se kterými se pracuje v dalších kapitolách. Tato stručnost popisu ztěžuje orientaci a pochopení souvislostí. Šestá kapitola se zabývá volbou metody pro optimalizaci čtení dat pro časově granulovaný přístup k datům. Chybí zde podrobnější rozbor možných řešení a výsledkem této kapitoly je návrh optimalizace formou výpočtu a uložení do databáze statistických údajů s týdenní granularitou namísto doposud použité metody výpočtu před zobrazením. Bez bližšího rozboru problematiky je zde konstatováno, že bude třeba realizovat soubor nových metod (str. 46) pro zajištění požadované nové funkcionality. Sedmá kapitola se zabývá úpravami existujícího datového modelu a implementací programových modulů pro týdenní agregaci dat. Chybí zde alespoň stručný popis existujícího datového modelu a je zde opět pouze konstatováno, že bude provedeno doplnění souboru tabulek o potřebné rodiny sloupců. Za přínosnou a srozumitelně popsanou část v této kapitole je možné považovat popis problematiky při přechodu mezi denní, měsíční a nově navrženou týdenní granularitou dat. V osmé kapitole řeší diplomant implementaci rozhraní koprocesoru. Kapitola obsahuje opět řadu pojmů, se kterými se zde pracuje, je zde však nedostatečné popsána souvislost mezi použitými pojmy, což ztěžuje pochopení logiky a souvislostí. Z popisu je zřejmé, že autor problematice rozumí, forma textu ale není vhodná pro technickou zprávu. Devátá kapitola řeší implementaci rozhraní upravené komponenty sortserver a desátá kapitola se zabývá integračními testy navrženého systému. Obecně lze konstatovat, že kapitoly 5 až 10 trpí nedostatkem srozumitelnosti a na řadě míst i absencí informací, nutných pro pochopení. I přes uvedené výtky je práce sestavena v logickém sledu, jsou zde uvedeny odkazy na použitou literaturu. Z příloh, dodaných k diplomové práci není jasně patrné, které soubory jsou nové dílo autora a které soubory byly pouze modifikované. Dodané DIFF soubory nejsou vhodnou dokumentací, pouze se z nich dá tušit rozsah provedených úprav. Při práci musel diplomant zvládnout širokou problematiku od použití HBase NoSQL databáze, přes pochopení práce existujícího informačního systému, zvládnutí řady nástrojů pro vývoj a testování nových funkcionalit. Zadání diplomové práce bylo splněno, úpravy jsou nasazeny na produkčním prostředí a dodané testy potvrzují dosažení úspory v čase.

Navrhovaná známka: C

Body: 70

Otázky

1. Jaká je úspora času při zobrazování týdenních statistik původní a Vaší novou metodou.
2. Kolik a jakých nových programových jednotek je Vaše autorské dílo a kolik programových jednotek bylo Vámi modifikováno v rámci optimalizace.