SLÁMA, Š. Pokročilá klasifikace poruch srdečního rytmu v EKG [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2020.

Posudky

Posudek vedoucího

Ronzhina, Marina

Student Štěpán Sláma se ve své práci věnoval realizaci postupů pro automatickou klasifikaci EKG záznamů do pěti kategorií s využitím moderních metod strojového učení. Pro zdárný návrh a implementaci postupů si musel nastudovat velké množství literatury tykající se projevů srdečních arytmií v EKG a klasifikace dat pomocí hlubokých neuronových sítí. Při realizaci vlastního řešení (tzv. from scratch), se ze začátku potýkal s technickými problémy, proto se vydal cestou využití dostupných předučených modelů. Toto řešení ovšem vyžaduje transformaci původních dat do specifikované podoby. K tomu student zvolil časově-frekvenční rozklad EKG s následným výběrem jen určitých pásem, případně i transformaci pomocí PCA. Daný postup je velice náročný na výběr vhodných parametrů rozkladů, aby výsledná reprezentace EKG obsahovala diagnosticky užitečné informace. Tato část by si jistě zasloužila detailnějšího prozkoumání, což by určitě vedlo k efektivnějšímu trénování modelů a spolehlivější klasifikaci. Kladně hodnotím snahu studenta vytvořit vlastní fungující modely „na míru“, což se mu nakonec povedlo. Zde se bohužel ocitl v menší časové tísni a vzhledem k časové náročnosti trénovacího procesu tak neměl možnost provést důkladnou optimalizaci všech parametrů algoritmu. Nicméně, tyto výstupy mají potenciál dalšího využití při vývoji nových vícekategoriálních klasifikátorů. Student využíval konzultací v průběhu celého roku. Vzhledem k náročnosti implementovaných metod však nestihl zapracovat některé důležité poznámky vedoucí. Hlavním nedostatkem v navržených postupech považuji využití různých trénovacích a testovacích vzorů pro jednotlivé modely, což mohlo vest ke zkresleným závěrům při porovnání modelů mezi sebou. I přes veškeré zmíněné potíže se však studentovi podařilo nastudovat velké množství sofistikovaných metod, implementovat několik různých klasifikačních postupů a dosáhnout zajímavých výsledků. Velmi oceňuji jeho aktivní a zodpovědný přístup k práci, samostatnost a cílevědomost. Všechny body zadání byly splněny. Práci hodnotím stupněm B/87 b.

Navrhovaná známka
B
Body
87

Posudek oponenta

Hejč, Jakub

Student Štěpán Sláma se ve své práci věnuje návrhu modelů hlubokého učení za účelem klasifikace EKG záznamů do 5 různých skupin. V práci byly otestovány 4 různé architektury hlubokých sítí v kombinaci s různými přístupy při předzpracování signálu. Z toho ve dvou případech byly využity předučené architektury Xception a ResNet152 a ve dvou případech vlastní implementace jednoduché konvoluční a rekurentní sítě inspirované odbornou literaturou. Práce je svým rozsahem nadstandardní, zásadním nedostatkem je však absence systematického přístupu a hlubšího porozumění problematiky. Volba jednotlivých architektur a jejich hyperparametrů je ve většině případů nekriticky převzata z literatury. U žádného z modelů nebyla provedena adaptace architektury na předložená data a systematická optimalizace hyperparametrů. Student sice provedl několik více či méně náhodných pokusů o nastavení, avšak bez uvedení konkrétních výsledků. Data jsou naopak upravena tak, aby jejich formát vyhovoval předučeným architekturám, které vznikly za zcela jiným účelem. Takový postup by se dal s výhradami akceptovat v případě, že by cílem práce bylo porovnání klasifikačních schopností zvolených architektur pro daný dataset. V takovém případě je však nutné modely trénovat a validovat na stejných datových sadách, což díky vlastnostem implementovaného generátoru nebylo dodrženo. V práci také postrádám zmínku o použité kriteriální funkci a způsobu určení vah pro jednotlivé kategorie. Pro každý z modelů dále byly vyzkoušeny různé metody předzpracování EKG signálů, konkrétně krátkodobá Fourierova, vlnková a Karhunen-Loevova transformace. Obdobně jako u klasifikačních modelů by v této části bylo třeba hlouběji zdůvodnit zvolené parametry použitých metod (např. typ vlnky, frekvenční rozsah, časové a frekvenční rozlišení, počet hlavních komponent, atd.) a možný vliv jak na zkreslení signálů tak na klasifikační schopnost modelů. Stejně tak je třeba odůvodnit a vyhodnotit vliv míry zašumění signálu Gaussovským šumem při augmentaci dat, případně zvážit další typy rušení, které se v EKG běžně vyskytují. S některými zvolenými postupy a jejich zdůvodněním pak nelze zcela souhlasit. Např. zdůvodnění volby použitých EKG svodů vychází z chybné interpretace základních principů elektrokardiografie a literatury, která se zabývá klasifikací jiných poruch srdečního rytmu a výběr autorů byl značně omezen použitou databází. EKG signály také není možné standardizovat pomocí měnících se statistických momentů vypočtených vždy z konkrétního záznamu, neboť tím dojde ke zkreslení dynamiky původního signálu. Výsledky modelů jsou vzhledem k výše uvedenému celkem očekávané. Nutno však podotknout, že kvalita databáze pro trénování klasifikačního modelu do zvolených skupin není příliš velká a bez optimalizace hyperparametrů lze velmi dobrých výsledků dosáhnout poměrně obtížně. Po odborné stránce je práce spíše pod průměrem. Text obsahuje množství nepřesných či neodborných tvrzení, a to jak v teoretické tak praktické části práce. Např. na obr. 7.32 došlo evidentně k přeučení modelu. Komentář pod obrázkem však tvrdí, že se model “stává více efektivní”. Po formální stránce je práce na průměrné úrovni. Jazyková i logická skladba vět místy nedává smysl a působí jako komprimovaný výstup automatického jazykového překladače. Na řadě míst tak čtenář může jen odhadovat, jakou informaci chtěl autor vlastně sdělit. V praktické části se vyskytují obrázky nízké kvality a obrázky, které obsahově neodpovídají textu. Např. na obr. 7.16 jsou jako výsledek PCA zobrazeny tři shodné signály a na obr 7.17 jsou pro tři různé EKG signály znázorněny tři totožné spektrogramy. U spektrogramů (např. obr. 7.11) je zvykem uvádět fyzikální jednotky, nikoliv rozměry použité datové struktury. Přes uvedené výtky student splnil zadání práce. Ze zdrojových kódů je patrné, že student porozuměl tématu přinejmenším na implementační úrovni. Na jednu stranu hodnotím pozitivně chuť vyzkoušet různé přístupy a modely, na druhou stranu by práce získala na kvalitě, kdyby se řídila heslem “méně je někdy více”. Práci doporučuji k obhajobě a hodnotím ji 68 body.

Navrhovaná známka
D
Body
68

Otázky

eVSKP id 126848