KALIANKOVÁ, K. Znakově-orientované metody DNA barcodingu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.

Posudky

Posudek vedoucího

Maděránková, Denisa

Po formální stránce je předložená práce na nízké úrovni; např.: citace literatury neodpovídá normě, úvod práce má nestandardně dvě podkapitoly, chybí seznam obrázků, nadpisy sloupců a řádků tabulek 1 až 5 jsou nevhodné, některé informace v teoretické i praktické části práce se opakují vícekrát po sobě, některé věty nedávají smysl. Seznam literatury obsahuje pouhých 8 zdrojů, přičemž polovina z nich jsou odkazy na online nástroje a databáze. Rozsah práce neodpovídá požadavkům na diplomové práce. Na řádnou konzultaci během semestru přišla studentka pouze jednou, rozpracovanou práci v termínu neodevzdala. Na další konzultaci se dostavila až dva týdny před odevzdáním, přičemž míra rozpracovanosti práce byla velmi nízká. Dle zadání měla studentka realizovat vlastní vylepšenou verzi metody BLOG či přijít s vlastním řešením. V práci popsané řešení je značně triviální a mělo sloužit pouze jako základní kostra vlastní metodiky. Skórovací systém pro porovnávání konzervovaných a nekonzervovaných pozic je zvolen náhodně a je nesmyslný, což se projevilo špatnými výsledky. V závěru práce studentka skórovací systém mírně upravila, ale již dostatečně neotestovala. Celkové skóre sekvencí při analýze není nijak normalizováno, tudíž je závislé na délce porovnávaných sekvencí, což vede ke špatným výsledkům. Skóre pro konzervované a nekonzervované pozice nelze sumovat, opět to vede ke špatným výsledkům. Vzhledem k tomu, že metoda byla testována na velmi malém a vhodně zvoleném souboru dat, tak se většina možných problémů neprojevila. Praktické zpracování zadání a rozsah testování je na diplomovou práci nedostatečné. Zadání práce nebylo splněno.

Navrhovaná známka
F
Body
40

Posudek oponenta

Sedlář, Karel

Studentka se ve své práci zabývá zajímavou tématikou identifikace DNA sekvencí. Bohužel vlastní text práce shrnutý na 38 stranách je podložen pouze 8 zdroji a jeho formální zpracování kvůli množství překlepů, špatné práci s literaturou, nelogickému členění textu a dalším nedostatkům neodpovídá požadavkům kladeným na diplomovou práci. Text práce sice sleduje jednotlivé body zadání, některé z nich však neshledávám jako dostatečně zpracované, jedná se především o body 3) a 5) zabývající se srovnáním různých metod. Odborná úroveň práce je také velmi nízká, což je způsobeno nedostatečným využíváním kvalitních zdrojů. Dochází tak k zcela zásadním chybám, například při popisu vlastního algoritmu, kde autorka označuje matici četnostního profilu jako sekvenční logo. Také mi není jasné, proč vlastní metodu studentka pojmenovala stejně jako metodu již existující - BLOG. Přiložený kód v jazyce Matlab navíc pro zdárné spuštění potřebuje drobnou úpravu. Největší nedostatek práce spočívá ve zcela nevyhovujícím vyhodnocení dosažených výsledků. Testovací množiny sekvencí nejsou dostatečně velké a jejich rozdělení na trénovací a validační množinu nerespektuje základní zvyklosti pro hodnocení technik strojového učení a dolování dat, mezi které popsané metody zcela jistě patří. U každé metody navíc autorka hodnotí jiné parametry.

Navrhovaná známka
F
Body
45

Otázky

eVSKP id 84430