GREGOROVÁ, K. Evoluční modely pro vyhodnocení příbuznosti organismů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.

Posudky

Posudek vedoucího

Škutková, Helena

Studentka Kateřina Gregorová se ve své práci zaměřila na evoluční modely pro popis bodových mutací v biologických sekvencích. Aktivita studentky v průběhu řešení práce byla nedostatečná. Přesto že byla na tuto skutečnost upozorňována již při obhajobě semestrálního projektu, začala navazující bakalářskou práci řešit až ke konci semestru, intenzivněji pak poslední dva týdny před odevzdáním. Finální verze mi byla zaslána ke kontrole až večer před odevzdáním. Ačkoliv dílčí body zadání vypadají na první pohled alespoň na minimální úrovni jako splněné, odborné chyby, jichž se studentka při jejich vypracování dopustila, znehodnocují dosažené výsledky. Teoretická část práce je jen přehled základních modelů, kde hlavním literárním zdrojem jsou materiály ke cvičení z předmětu Analýza biologických sekvencí (FABS). Studentčin výklad je však často chybný, některé vzorce nejsou dostatečně popsány a použité symboly vysvětleny. Chybí zde srovnání použitelnosti a přesnosti uvedených modelů. Zařazení některých podkapitol je matoucí (kap. 2.8, 3.1.1, 3.1.2). Praktická realizace práce je z velké části založená na zdrojových kódech z cvičení FABS. Jejich vzájemné propojení je však v části předzpracování sekvencí na vstupu neodladěné, mezi nedostatky patří např. chybějící kontrola terminačních kodónů, výběr kódujících úseků, mnohonásobné zarovnání všech sekvencí apod. Jako největší chybu považuji vyhodnocení proteinové evoluce na základě nukleotidových sekvencí, výsledky v kapitole 8 jsou tak nesmyslné. Chybí zde vzájemné srovnání všech nukleotidových modelů na různých typech sekvencí. Závěry kapitoly 10 zaměřené na vyhodnocení vztahu mezi kodonovými, nukleotidovými a aminokyselinovými modely jsou nepodložené. V každé části analýzy modelů jsou navíc použity jiné typy sekvencí a nedají se tak najít mezi výsledky souvislosti. Volbu sekvencí studentka zdůvodňuje výpočetní náročností algoritmů, problémem je však vytvořené uživatelské rozhraní, které stále dokola počítá všechny parametry všech modelů, i když zvolíte jeden konkrétní. Blokové schéma uživatelského rozhraní Obr. 5.2 je chybné. Po formální stránce je práce zatížena nespočtem gramatických chyb, překlepů a komolením jmen autorů a názvů použitých metod. Z uvedených důvodů hodnotím předloženou práci jako nedostatečnou.

Navrhovaná známka
F
Body
40

Posudek oponenta

Maděránková, Denisa

Studentka Kateřina Gregorová vypracovala bakalářskou práci na téma Evoluční modely pro vyhodnocení příbuznosti organismů. Práce má 29 stran textu, 20 literárních zdrojů, přičemž zdroje nejsou uvedeny v pořadí, v kterém jsou citovány v textu, a 4 zdroje nejsou v textu zmíněny vůbec. Po formální stránce trpí práce mnohými gramatickými chybami, překlepy a stylistickými chybami. Dalšími nedostatky jsou např.: příloha 1 je nadbytečná, nejsou uvedeny zdroje obrázků, vzorec 2.3 je špatně zapsán, není vysvětlen význam veličin v některých vzorcích, kapitola 6 patří do teoretického úvodu, blokové schéma 5.2 je špatně. Odborná úroveň práce je velmi nízká. Je zde velké množství zavádějících, nepřesných a nesprávných tvrzení i na úrovni základních poznatků z bioinformatiky, např.: stejná aminokyselina je kódována celou řadou různých proteinů, nebo že p-distance může být vyšší než 1. Naprogramováno bylo 6 nukleotidových modelů, 1 model pro aminokyseliny plus 2 druhy korekcí a 2 modely pro kodony, přičemž není jasné, o jaké kodonové modely se jedná. Množství programového kódu studentka použila ze cvičení k předmětu FABS. Program je funkční pouze pro genbank formát dat, bylo by vhodné používat i formát fasta. Uživatelské rozhraní dovoluje výběr modelu, ale výpočet probíhá pro všechny modely v dané kategorii. Výsledný strom se vykresluje samostatným tlačítkem, přičemž data se načítají ze zobrazené distanční matice, která může odpovídat dříve načteným datům a jinému evolučnímu modelu. Během výpočtu dochází ke zbytečnému výpisu v příkazovém řádku. Distanční matice se počítá celá, přičemž je však symetrická podle diagonály. Kód uživatelské aplikace je značně nadbytečný a je z něj patrné nepochopení základních principů algoritmizace, jako je např. volání funkcí. V modelů pro aminokyseliny není rozdíl mezi modelem JC bez korekce a s Poissonovou korekcí. Z programového hlediska je nedostatků větší množství. V práci chybí podrobnější popis dat pro analýzu (počet sekvencí v souboru, jejich délka, organismy). Analyzováno bylo jen několik z naprogramovaných modelů na vybraných souborech, přičemž nebyly použity všechny soubory, které byly v úvodu praktické části práce zmíněny. K některým analýzám chybí obrázky stromů. Soubory pro protein-kódující sekvence obsahují i nekódující části, což studentka nezohlednila a porovnávala celé sekvence v souborech, což vede k nesprávným výsledkům, viz např. stromy gen NEFL. V případě výpočtu s modely pro aminokyseliny se chybně pracuje s nukleotidovými sekvencemi. Studentka porovnává stromy pro jednotlivé modely mezi sebou pomocí Pearsonova korelačního koeficientu a Robinsonovy-Fouldovy vzdálenosti, přičemž by však měla stromy pro modely porovnávat s referenčním stromem, který vyjadřuje skutečnou taxonomii organismů. Diskuze výsledků a jejich interpretace je nedostatečná. Předložená práce nesplňuje kvalitativní požadavky kladené na bakalářskou práci.

Navrhovaná známka
F
Body
30

Otázky

eVSKP id 84342