VANĚČKOVÁ, T. Numerické metody pro klasifikaci metagenomických dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.

Posudky

Posudek vedoucího

Škutková, Helena

Studentka Tereza Vaněčková se ve své diplomové práci zaměřila na poměrně nové experimentální téma využití metod charakteristických četností nukleotidových slov pro metagenomickou klasifikaci. K tomuto tématu vypracovala kvalitní literární rešerši podloženou 67 převážně zahraničními referencemi. Navrhla a v programovém prostředí Matlab realizovala vlastní metodiku klasifikace kombinující pět četnostních metod vycházejících z aktuálních zahraničních publikací s pokročilými metodami redukce dimenzionality dat a hierarchickým i nehierarchickým shlukováním. Zvolené metody testuje na vhodně vytvořených setech simulovaných metagenomických dat a řádně statisticky vyhodnocuje. Vytknout lze jen poněkud nižší úspěšnost navržené metodiky při testování na reálných metagenomických datech, což však je částečně odůvodnitelné nízkou anotovaností databázových záznamů. Po formální i odborné stránce je práce na výborné úrovni. Studentka přistupovala k řešení práce aktivně a své výsledky pravidelně konzultovala.

Navrhovaná známka
A
Body
94

Posudek oponenta

Sedlář, Karel

Cílem diplomové práce studentky Terezy Vaněčkové bylo provést implementaci a následné srovnání numerických metod pro klasifikaci metagenomických dat. Úvodní část, ve které se studentka zabývá pojmy souvisejícími s metagenomikou a sekvenací DNA, obsahuje některá nepřesná tvrzení, například ohledně délky čtení sekvenačních technologií nebo jejich komerční dostupnosti. Naopak navazující část, která pojednává o jednotlivých metodách klasifikace metagenomických dat a kterou považuji za jádro práce, je velmi kvalitní literární rešerší. Na tuto část navíc studentka navazuje praktickým a vhodně realizovaným srovnáním všech zmíněných metod na dobře vyhovujícím souboru dat. Jedinou připomínku mám k dendrogramům, kde by bylo pro účely práce vhodnější místo číselného kódování listů použít kódování barevnou značkou. Konec práce je bohužel poněkud nelogicky členěn, kdy celá diskuse probíhá až v závěru. To má za následek, že je z práce špatně patrný vlastní přínos autorky. Po formální stránce je jinak práce na dobré úrovni. Byť pokládám zadání práce za bezezbytku splněné, chybí mi v práci vyhovující praktický výstup, který by byl určitě velmi žádoucí, protože metody, které jsou v práci prezentované, postrádají dostupné implementace v bioinformatice běžně rozšířených jazycích jako jsou R/Bioconductor nebo Python. Případně by alespoň ke kódu implementovanému v Matlabu bylo vhodné sepsat lepší nápovědu a umístit jej na veřejný portál, například Github. Přes uvedené výtky považuji práci za kvalitní a doporučuji ji k obhajobě.

Navrhovaná známka
B
Body
89

Otázky

eVSKP id 93564