VANĚČKOVÁ, T. Numerické metody pro klasifikaci metagenomických dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.
Studentka Tereza Vaněčková se ve své diplomové práci zaměřila na poměrně nové experimentální téma využití metod charakteristických četností nukleotidových slov pro metagenomickou klasifikaci. K tomuto tématu vypracovala kvalitní literární rešerši podloženou 67 převážně zahraničními referencemi. Navrhla a v programovém prostředí Matlab realizovala vlastní metodiku klasifikace kombinující pět četnostních metod vycházejících z aktuálních zahraničních publikací s pokročilými metodami redukce dimenzionality dat a hierarchickým i nehierarchickým shlukováním. Zvolené metody testuje na vhodně vytvořených setech simulovaných metagenomických dat a řádně statisticky vyhodnocuje. Vytknout lze jen poněkud nižší úspěšnost navržené metodiky při testování na reálných metagenomických datech, což však je částečně odůvodnitelné nízkou anotovaností databázových záznamů. Po formální i odborné stránce je práce na výborné úrovni. Studentka přistupovala k řešení práce aktivně a své výsledky pravidelně konzultovala.
Cílem diplomové práce studentky Terezy Vaněčkové bylo provést implementaci a následné srovnání numerických metod pro klasifikaci metagenomických dat. Úvodní část, ve které se studentka zabývá pojmy souvisejícími s metagenomikou a sekvenací DNA, obsahuje některá nepřesná tvrzení, například ohledně délky čtení sekvenačních technologií nebo jejich komerční dostupnosti. Naopak navazující část, která pojednává o jednotlivých metodách klasifikace metagenomických dat a kterou považuji za jádro práce, je velmi kvalitní literární rešerší. Na tuto část navíc studentka navazuje praktickým a vhodně realizovaným srovnáním všech zmíněných metod na dobře vyhovujícím souboru dat. Jedinou připomínku mám k dendrogramům, kde by bylo pro účely práce vhodnější místo číselného kódování listů použít kódování barevnou značkou. Konec práce je bohužel poněkud nelogicky členěn, kdy celá diskuse probíhá až v závěru. To má za následek, že je z práce špatně patrný vlastní přínos autorky. Po formální stránce je jinak práce na dobré úrovni. Byť pokládám zadání práce za bezezbytku splněné, chybí mi v práci vyhovující praktický výstup, který by byl určitě velmi žádoucí, protože metody, které jsou v práci prezentované, postrádají dostupné implementace v bioinformatice běžně rozšířených jazycích jako jsou R/Bioconductor nebo Python. Případně by alespoň ke kódu implementovanému v Matlabu bylo vhodné sepsat lepší nápovědu a umístit jej na veřejný portál, například Github. Přes uvedené výtky považuji práci za kvalitní a doporučuji ji k obhajobě.
eVSKP id 93564