PANÁČEK, R. Wavefield syntéza pro lineární pole reproduktorů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.

Posudky

Posudek vedoucího

Schimmel, Jiří

Cílem diplomové práce bylo implementovat panorámování virtuálního zdroje zvuku v lineárním poli osmi reproduktorů pomocí Wavefield syntézy v reálném čase. Diplomat zpočátku přistupoval k řešení práce laxně, následně se jeho přístup zlepšil a zvládnul i implementaci metody v reálném čase pomocí Audio toolboxu Matlabu. Vytvořený algoritmus neumožňuje změnu pozice zdroje zvuku v reálném čase, ta musí být zadána dopředu, ale je funkční. Kvůli nedostatku času byl proveden pouze pilotní poslechový test, na kterém měla být ověřena jeho metodika. V rámci tohoto testu nebyla ani otestována lokalizace vzdálenosti zdroje zvuku, pouze azimutu. K otestování přesnosti lokalizace ve volném a difúzním poli pro různé vzdálenosti reproduktorů, jak je uvedeno v zadání, nedošlo. Diplomant nedokáže pracovat s literaturou, což se projevilo jak u návrhu algoritmu, tak u poslechového testu, kdy se příliš nesnažil si najít nějaké podklady. Algoritmus panorámování z počátku navrhoval sám a nesmyslně, u poslechového testu také problematiku nenastudoval. Text práce nebyl před odevzdáním předložen ke kontrole, na některých místech proto obsahuje nesprávná tvrzení, v textu nejsou správně formátovány proměnné a zbytečně používá anglické termíny. Přestože diplomant dostal k dispozici relevantní literaturu zabývající se teorií Wavefield syntézy i implementací algoritmu, v textu vychází zejména z přehledové publikace [1], zásadní části algoritmu nejsou dostatečně popsány a naopak se detailně zabývá minoritními problémy, jako je získání kmitočtu spektrálního koeficientu z jeho indexu. Místo toho, aby do textu vložil výpisy kódu, vkládá jednotlivé řádky do textu a čtenář musí mít při čtení popisu implementace otevřenou elektronickou přílohu, aby se v textu zorientoval. Za zásadní formální nedostatek ale považuji absenci odkazů na literaturu v textu. V celé práci je pouze jeden odkaz na literaturu [6]. V seznamu literatury je jen 6 zdrojů, navíc špatně citovaných. Kvůli zmíněným zásadním formálním nedostatkům navrhuji o stupeň horší hodnocení diplomové, než odpovídá jejím výsledkům.

Navrhovaná známka
D
Body
65

Posudek oponenta

Balík, Miroslav

Diplomová práce pana Panáčka se zabývá panorámováním virtuálního zdroje zvuku pomocí metod vycházejících z teorie syntézy zvukového pole. Náplní práce měl být nejen teoretický rozbor použitých metod, ale také implementace systému panoramování v Matlabu, což se nakonec podařilo i v reálném čase s určitými omezeními. Práce má tak poměrně široký záběr a ze strany studenta bylo odvedeno nemalé množství práce. Bohužel, výčet nedostatků je poměrně rozsáhlý, a to jak v teoretické, tak praktické části práce, i ve způsobu, jakým je dokument diplomové práce psaný. Práce nemá na začátku jasně uvedené cíle, v průběhu čtení dokumentu je patrná změna cílů (mezi kapitolou 4 a 5), která není zdůvodněna, je navrhován jiný další algoritmus. Z textu není jasné, které jeho části jsou autorské, které jsou citované, v celém dokumentu se vyskytují pouze dvě neforemné faktické citace. Přitom autor několikrát používá formulaci „v literatuře se uvádí“, neuvádí však v které literatuře a na to vágně navazuje svá odůvodnění a dedukce, které bohužel nejsou vždy správné. Občas také vychází z nezdůvodněných předpokladů, na kterých staví další výklad. Autor tak dokladuje, že neumí pracovat s literaturou a psát odborný text. Způsob popisu rozebíraných matematických funkcí není proveden dle zvyklostí, opět není patrné, z kterého zdroje je čerpáno nebo zda je jejich autorem, často nejsou ad-hoc vysvětleny jednotlivé parametry či veličiny ve funkci použité. Místo toho jsou bez křížového odkazu rozebírány ve zcela jiné části textu, text je tedy velmi nepřehledný a jen stěží čitelný. V případech, kdy je vhodné popsat jasně a přesně problematiku sadou matematických zápisů, či vhodně zvolených vysvětlujících obrázků nebo grafických závislostí jasně deklarujících problém, je toto popsáno formou rozsáhlého textu, který nemá zrovna nejlepší větnou stavbu. Naopak jindy je použit obrázek (např. 4.3), jehož informační hodnota je vzhledem k probírané problematice v podstatě nulová. V textu se ojediněle vyskytují překlepy nebo chybné skloňování slov, jen poměrně málo časté jsou nedostatky v matematických zápisech. V praktické části práce nejsou pro popisy algoritmů použity vývojové diagramy, UML nebo jiné prostředky pro popis vytvářených funkcí, textový popis je naprosto nepřehledný, v textu se ani nevyskytují části kódu, kontrolovat kód je tak v podstatě nemožné. Je patrné, že student měl minimální zkušenosti s Matlabem, což je patrné jak v popisu, tak v samotných skriptech. Implementace v reálném čase je pak provedena nevhodným způsobem, student nemá žádné zkušenosti s implementací složitějších segmentačních algoritmů, což tato úloha s požadovanou proměnnou délkou segmentů vyžaduje. Bohužel ani provedené subjektivní poslechové testy nejsou provedeny dle zvyklostí a nemohu je považovat za zcela vypovídající. Při hodnocení těchto testů v závěru práce diplomant uvádí, že potvrdily funkčnost jeho postupů a případné odchylky jsou popsány a zdůvodněny. Již v prvním testu je rozptyl ve dvou modelovaných směrech zdroje zvuku diskutabilní, k žádné adekvátní diskusi však v textu ani jinde nedošlo. Práce na mne působí dojmem, že nedocházelo ke komunikaci s vedoucím práce, čemuž odpovídá způsob, jakým je vyvedena. Rozsáhlá část poměrně zbytečných nedostatků je způsobena neznalostí, jak správně postupovat. Z výše uvedených důvodů hodnotím práci známkou D/68 bodů.

Navrhovaná známka
D
Body
68

Otázky

eVSKP id 141421