PROCHÁZKA, O. Metody detekce selekce v DNA sekvencích [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.

Posudky

Posudek vedoucího

Škutková, Helena

Student Ondřej Procházka se ve své diplomové práci zaměřil na metody odhadu selekčního tlaku v DNA sekvencích. Vypracoval odpovídající literární rešerši podloženou 47 literárními zdroji. V programovém prostředí Matlab realizoval dvě standardní metody detekce selekce v sekvencích a jednu pokročilou metodu. Programovou implementaci metod doplnil o praktické grafické uživatelské rozhraní umožňující, kromě vyhodnocení selekce globálně a lokálně v plovoucím okně, i výběr kódujících úseků genů, jejich párové i mnohonásobné zarovnání a statistické vyhodnocení odhadu selekce pomocí Z-testu. Aktivita studenta v průběhu řešení práce byla přiměřená, své pokroky pravidelně konzultoval, přesto konečné vyhodnocení a statistické srovnání metod bylo provedeno poměrně ve spěchu. Zvolený soubor testovaných dat tak nebyl vybrán příliš vhodně pro spolehlivé určení typu selekce v sekvencích. Vytýkám i místy nevhodnou reprezentaci výsledků např. spojitý charakter křivek reprezentující nespojitá data v grafech na obrázcích 27 – 32 a poněkud vágní diskuzi výsledků. Po formální stránce se v práci vyskytují jen drobné nedostatky jako nesprávné zarovnání odstavců a vzorců, nebo nižší kvalita některých grafů. Přes zmíněné nedostatky hodnotím práci jako velmi dobrou.

Navrhovaná známka
B
Body
82

Posudek oponenta

Maděránková, Denisa

Formální stránka předložené diplomové práce je převážně na dobré úrovni, avšak vytkla bych několik bodů: úvod práce je spíše výčtem obsahu práce, některé obrázky jsou zbytečně velké či v horší kvalitě, špatné používání čárek ve větách, názvy nukleotidů a aminokyselin jsou uváděny s velkým počátečním písmenem a nejednotný formát zápisu literárních zdrojů. Odborná úroveň práce je dobrá. Implementované metody jsou v teoretické části srozumitelně popsány, až na chybu v příkladu výpočtu parametru s u metody Nei-Gojobori. Kapitola o alternativních genetických kódech je zbytečně rozsáhlá, naopak postrádám kapitolu o v současnosti nejpoužívanějším nástroji pro predikci selekce, což je nástroj PAML. Dále mám výtky ke způsobu vyhodnocení testování metod. Implementované metody predikce selekce jsou porovnávány navzájem včetně různého nastavení velikosti výpočetního okna, avšak výsledky nejsou porovnány se skutečným stavem, tj. skutečným výskytem pozitivní či negativní selekce. Pro první testovaný set sekvencí genu BRCA1 je publikováno mnoho prací, s jejichž výsledky lze výsledky předložené diplomové práce porovnat. Druhý testovaný soubor mitochondriálního genu cytb považuji pro účel testování predikce selekce za nevhodný. Značnou část vyhodnocení výsledků zaujímá vyhodnocení procentuálního zastoupení oken s pozitivní či negativní selekcí, avšak uniká mi význam tohoto vyhodnocení, když to není porovnáno se skutečným výskytem selekce. Vytvořený uživatelský nástroj je v základu funkční, ale potřebuje doladit některé části jako je např. výběr analyzovaného genu ze souboru s více geny, kdy se výběr musí provádět pro každý organismus zvlášť. Dále chybí možnost exportu výsledků do souboru, např. jako excel tabulka. I přes uvedené výtky bylo zadání práce splněno a vytvořený nástroj považuji za hodnotný.

Navrhovaná známka
C
Body
75

Otázky

eVSKP id 93556