NERUŠIL, V. Vyhledávání CpG ostrůvků z DNA sekvencí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.

Posudky

Posudek vedoucího

Kubicová, Vladimíra

Student se v práci věnoval popisu metod na vyhledávání CpG ostrůvků a v programovém prostředí Matlab naprogramoval dvě vlastní metody pro jejich vyhledávání. Student přistupoval k řešení samostatně. První metoda vychází z literatury, kde student zjednodušil vyhledávání návrhem vlastního postupu, druhá metoda je výsledkem autorovy invence. Student nastavil vstupní parametry obou metod, toto nastavení by však žádalo obsáhlejší diskuzi, zejména diskuzi vlivu nastavení na přesnost detekce CpG ostrůvků. Dále není jasné, jak autor získal přesnost vyhledání u sekvence s odchylkou 0 bp, když posun okna při konstrukci spektrogramu byl 20 bp. V práci by bylo vhodné uvést také porovnání časové náročnosti navržených metod a již existujících metod. Pro testování algoritmů bylo použitých celkem 5 DNA sekvencí různé délky. Pozitivně hodnotím, že student na otestování použil i 185 kbp dlouhý úsek lidského chromozomu 21 a že dosažené výsledky obou metod byly porovnány s výsledky až z osmi již navržených vyhledávačů CpG ostrůvku. Student splnil zadání práce.

Navrhovaná známka
B
Body
85

Posudek oponenta

Provazník, Ivo

Student Václav Nerušil se zabýval počítačovými metodami automatické analýzy biologických sekvencí, konkrétně vyhledávání tzv. CpG ostrůvků v sekvencích DNA. Tyto přesně definované krátké úseky sekvencí je nutné spolehlivě vyhledávat v rozsáhlých datech pro predikci možného patologického útlumu exprese genů. Text práce je v rozsahu 52 stran bez příloh a obsahuje seznam 30 relevantních odborných pramenů. Po formální stránce je práce zpracovaná standardně, struktura a úprava textu je akceptovatelná. V práci se vyskytují některé nedostatky. Např. na str. 10 je zmíněn nedefinovaný pojem "Alu repetice". V textu je na několika místech používán standardní hodnoticí poměr ObsCpG/ExpCpG, nicméně parametry vystupující v poměru nejsou definovány. Práce obsahuje stručný úvod do problematiky s uvedením přehledu metod, které jsou dnes pro vyhledávání CpG ostrůvků používány. Na to navazuje kapitola s návrhem vlastní metody založené na hodnocení spektrogramů. Zde by bylo vhodné ve větší míře uvádět zdůvodnění výběru jednotlivých kroků. Například: proč byla z mnoha možností vybrána právě 4D numerická reprezentace sekvencí, proč s provádí mapování hodnot do RGB barev (převod ze 4D do 3D prostoru), proč je provedena normalizace hodnot spektrogramu, proč se provádí sumace spekter, jaká je interpretace sumovaných spekter, a další. V závěrečné části je provedeno srovnání navržené metody s dalšími dostupnými metodami. Srovnání je však provedeno jen porovnáním výsledků analýzy jednotlivých sekvencí bez znalosti "správného výsledku". Pro řádné vyhodnocení metody by bylo nutné získat referenční data, metody otestovat na větší sadě sekvencí a statisticky vyhodnotit. Pokud referenční data nelze získat, je možné je namodelovat. Předloženou práci hodnotím přes uvedené výtky kladně a získané výsledky považuji za užitečné.

Navrhovaná známka
C
Body
78

eVSKP id 86978