Posudky závěrečné kvalifikační práce

PLESKAČOVÁ, B. Vyhodnocení numerických reprezentací pro detekci překryvů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.

Posudek vedoucího

Jugas, Robin

Bakalářská práce je zaměřena na aplikaci numerických reprezentací pro vyhledávání překrývajících se genomických signálů. Studentka provedla vyčerpávající rešerši teoretických základů zadaného tématu v kapitolách o sekvenaci DNA, gemovových sestaveních, numerických reprezentacích a konečně i o vzdálenostních metrikách, které by šlo využít. Již v teoretické části vyvozuje následky pro praktické řešení práce. Vlastní tvorbou je analýza, které numerické reprezentace a metriky jsou pro hledání překryvů vhodné. Tato analýza je dostatečně komplexní. Na základě této analýzy pak studentka vytvořila vlastní algoritmus pro hledání překryvů s jednoduchým vyhodnocením úspěšnosti detekce, který otestovala na reprezentacích a metrikách, které vzešly z předchozí analýzy využitelnosti. Výsledky dostatečně diskutuje. Z plného počtu strhávám body za formální nedostatky: méně pochopitelné rovnice 5.6 a 5.7, odlišnou velikost písma napříč obrázky, Z-křivka na obr. 5.5 by mohla být vykreslena ve 3D a překlepy. Studentka pracovala na práci průběžně a samostatně s využitím konzultací. Plně splnila zadání bakalářské práce. Práci hodnotím stupněm A (90 b.)

Navrhovaná známka: A

Body: 90

Posudek oponenta

Maděránková, Denisa

Studentka Barbora Pleskačová vypracovala bakalářskou práci na téma „Vyhodnocení numerických reprezentací pro detekci překryvů“. Vypracovaná literární rešerše se dostatečně věnuje sekvenačním metodám a metodám sestavení sekvencí. Obecnou kapitolu o DNA považuji za nadbytečnou, naopak kapitola o numerických reprezentacích mohla být zpracována s větší pečlivostí. Obecně je však text teoretické části práce dobrý. Mám několik výtek k formální stránce jako např.: kapitola Úvod nemá být očíslována, odkazy na literaturu v textu nejsou sousledné a literárních zdrojů je uvedeno 42, avšak textu jsou odkazy pouze na 30 z nich, některé zkratky nejsou v textu bezprostředně vysvětleny (např. W-C páry v kap. 2.1), překlepy, kterých je především v závěru hodně, obr. 5.2 až 5.6 mají zbytečný název v horní části. Po odborné stránce bych také měla několik výtek. V kapitolách o metodách sestavení sekvencí by bylo vhodné uvést graficky vyjádřený příklad základního principu metod. V kapitole 5 věnující se numerickým reprezentacím je několik obrázků sekvencí v jejich číselné podobě, není však nikde uvedeno, o jaké sekvence se jedná. Stejně tak není uvedeno, jaká konkrétní data byla použita pro testování algoritmu. U testování v kap. 6.8 není zdůvodněno, proč mají testovací sekvence délku 30 a 600 bp a také není jasné, jestli jsou to opravdu délky sekvencí nebo překryvy. Dále není zdůvodněno použití 3% a 5% zašumění a není jasné, jestli chybovost byla zanesena do půdních DNA sekvencí nebo až do jejich numerických reprezentací. Popis algoritmu je vysvětlen na hraně dostatečnosti. Algoritmus pro nalezení překryvů je vyhodnocen pouze na základě senzitivity pro data o délce 100 bp a 1000 bp pro tři hodnoty zašumění, avšak výsledky jsou shrnuty pouze tabulkově pro tři kombinace délka-chybovost. I přes uvedené výtky, bylo zadání práce splněno, a práci doporučuji k obhajobě s hodnocením C, 75 bodů.

Navrhovaná známka: C

Body: 75

Otázky

Jakou znakovou metodou by šlo vyhodnotit nalezené překryvy jako správné, jakou by šlo použít metriku?