PŘÍKAZSKÝ, D. Analýza hlasivkových pulzů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.

Posudky

Posudek vedoucího

Sigmund, Milan

Zadání diplomové práce je převážně splněno. Student pracoval samostatně, na konzultace přicházel s hotovými bloky programu a sepsanými částmi textu. Nastudoval problematiku hlasivkových pulzů a seznámil se se základními metodami na jejich měření a určování z hlasového záznamu. V této části však postrádám porovnání hlavních vlastností uvedených metod. Z toho by mělo vyplynout zdůvodnění, proč si autor z řady metod vybral k realizaci právě metody IAIF a Sahoo. Student vytvořil funkční software, který bude sloužit jako nástroj pro získávání průběhu hlasivkových pulzů a jejich archivaci pro účely následné analýzy zaměřené na detekci vybraných specifických jevů. Použitelnost SW usnadňuje obsáhlý návod s grafickou dokumentací. Po obsahové stránce mám k řešení jen několik připomínek. Bylo by vhodné provést porovnání získaných průběhů hlasivkových pulzů s výstupy software Aparat vhodnějším způsobem, než jen vynesením chybových křivek do společných grafů. Navíc není nikde uvedeno, jak byly průběhy chyb na obrázcích 3.1 a 3.3 vypočítány. V průběhu získaných hlasivkových pulzů byl zaveden lineární náběh a pokles u okrajových pulzů bez bližšího vysvětlení či zdůvodnění. U výstupních dat by vytvořený program měl určit a exportovat celistvý počet pulzů a neuřezávat okrajové pulzy. Tento jev není v práci uveden. Pro statistickou analýzu pulzů je nutné zpracovávat nahrávky o délce jednotky až desítky minut. Tuto situaci autor neřešil, ani neuvádí maximální možnou délku záznamu, kterou je SW schopen zpracovat (na str. 50 je jen uvedeno použití pro „řádově minimálně jednotky sekund“). Z praktického pohledu považuji omezení funkce SW na kratší úseky řeči za vážný nedostatek. Nad rámec zadání je v diplomové práci kapitola 5, kde student použil svůj program na získání hlasivkových pulzů pro další analytické zpravování s cílem detekovat z hlasu Parkinsonovu chorobu. Zde použil nahrávky ze studentské soutěže Biosignal Challenge 2018. Po formální stránce má práce obvyklou strukturu, je přehledná a dobře se čte. Autor věnoval hodně času na shromáždění potřebných aktuálních informací, včetně sehnání referenčního záznamu z glottografu. Celkový pěkný dojem z napsané práce snižuje několik (zbytečných) formálních prohřešků: - v textu se vyskytují překlepy (např. str. 8, 9, 11, 28, apod.) a drobné gramatické chyby (např. str. 5, 7, 16, apod.); - místy je použita nepřesná terminologie, např. záměna hlasový/hlasivkový trakt (str. 2), „Aalto-yliopistoská univerzita elektrotechniky“ (str. 9), „tlaková změna signálu“ (str. 23), apod.; - na obrázku 1.3 je nečitelný popis (malá velikost písma); - názvy obrázků 4.11 a 4.12 obsahují částečně tučný text bez bližšího opodstatnění.

Navrhovaná známka
B
Body
86

Posudek oponenta

Staněk, Miroslav

Předložená diplomová práce pana Davida Příkazského se zabývá zpracování řečových signálů, resp. analýzou hlasivkových pulzů. V první části práce se pan Příkazský zabývá teoretickým úvodem do dané problematiky včetně rešerše řečové syntézy, která je na můj vkus alternativně pojata, a popisu jednotlivých metod odhadu hlasivkových pulzů z řečového signálu včetně nezbytného matematického popisu modelů. Po představení teoretického základu se pan Příkazský zabývá už vlastní praktickou částí diplomové práce, která je ve formě uživatelské aplikace. Samotná aplikace disponuje grafickým uživatelským rozhraním, a je zrealizována v programovacím prostředí MATLAB. Jako značnou nevýhodu zde vidím pouze použití dvou estimačních algoritmů, z nichž jediný použitelný je IAIF z důvodu časové náročnosti. Získané výsledky glottal flow rovněž znázorňují chybně nulovou hladinu u neanalyzovaných úseků, což je v samotném finálním důsledku jedno. Získané koeficienty špičatosti/šikmosti by bylo vhodné zobrazit pro všechny hodnoty hlasivkových pulsů, což by vedlo k relevantnějším závěrům, které by měly být navíc potvrzeny vhodným statistickým testováním. Celkově je patrné, že za touto diplomovou prací stojí mnoho kvalitně odvedené práce, kterou by však bylo možné vhodněji prezentovat a dále analyzovat. Kvalitu práce rovněž snižuje čitelnost některých obrázků, formální chyby, nevhodná tvrzení a chybné anglické výrazy, a vyladěnost samotné aplikace. Nicméně i přes výše uvedené nedostatky oceňuji snahu a odvedenou práci pana Davida Příkazského, a jeho diplomovou práci doporučuji k obhajobě s navrženým hodnocením C/70b. Posudek vypracoval Ing. Miroslav Staněk, Ph.D., Honeywell Aerospace. Otázky k obhajobě: 1) Jaký je vliv parametru lip radiation na výsledný průběh/tvar odhadnutých hlasivkových pulzů? Jakou hodnotu jste zvolil a proč? Zkoušel jste jeho hodnotu rozmítat – jak poté vypadaly získané hlasivkové pulzy? 2) Co je obsaženo v uloženém zvukovém souboru po odhadu průběhu hlasivkových pulzů? 3) Jak byste svou aplikaci rozšířil pro větší použitelnost? Je nějaká oblast, která by stála za prozkoumání v rámci analýzy hlasivkových pulzů Vaší aplikací?

Navrhovaná známka
C
Body
70

eVSKP id 110442