PELOUŠEK, T. Simulace zkreslení zvukového signálu v percepčním zvukovém kodéru [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Posudky

Posudek vedoucího

Schimmel, Jiří

Student přistupoval k řešení diplomové práce aktivně a pravidelně konzultoval dosažené výsledky a další postup. Realizovanou aplikaci pro Matlab je možné využít ve výuce pro demonstraci funkce alokace bitů a přepínání oken, bylo by ale vhodné realizovat lepší grafické vyjádření přepínání oken, doplnit popisky os u alokace bitů, zobrazení začátku a konce úseku pro zpracování v jeho časovém průběhu, pokud uživatel změní parametry Start a End Offset, a v maximální míře využít vektorových operací, aby se urychlil výpočet. Aplikace také nemá možnost volit metody zpracování stereofonních signálů. Text práce je na dobré úrovni a dostatečného rozsahu, z formálního hlediska lze vytknout místy formátování proměnných v textu a obrázcích a to, že u některých není uveden jejich význam, ojedinělé překlepy a řadu obrázků rozdělujících odstavce. Požadovaná dokumentace k funkcím není v příloze textu, ale je vložena jako komentář přímo ve funkcích, což považuji za dostatečné. Zadání práce považuji za splněné, s drobnou výhradou k implementaci různých metod zpracování stereofonního signálu.

Navrhovaná známka
A
Body
90

Posudek oponenta

Rajmic, Pavel

Diplomová práce Bc. Tomáše Pelouška pojednává o kodeku MP3 a součástí práce je částečná simulace MP3 v MATLABu, vhodná zejména pro výukové účely. Oproti zadání není implementována komprese stereosouborů, jak student přiznává v Závěru. Zadání rovněž požaduje širší rešerši kodeků, ale práce se věnuje téměř výhradně formátu MP3. Po jazykové stránce působí práce rozpačitě. Některé bloky textu jsou napsané čtivě a prakticky bez chyb, aby pak byly vystřídány pasážemi, které se čtou obtížně a obsahují chyby a překlepy. Typografickou stránka práce bych hodnotil jako spíše podprůměrnou. Úvod není dobře napsaný. Neuvádí čtenáře do textu. Chybí motivace, text nemluví ani o tom, k čemu jsou kodeky dobré. Kapitola 1 o percepčním kódování zvuku je nejdelší, ale nejslabší ze čtyř kapitol. Měla začít alespoň stručným souhrnem, jak funguje lidské slyšení. Později totiž student používá pojmy z této oblasti, které ovšem v práci nejsou vysvětleny. Místo toho student rovnou začíná s popisem hybridního kodéru. Jde o popis technický, čtenáři však neposkytne ani jednu ze dvou funkcí, které text měl podle mého názoru mít: Za prvé, pochopit jak MP3 funguje -- na to je text napsaný příliš zmateně. Za druhé, vysvětlit PROČ komponenty kodéru dělají to, co dělají, ne pouze JAK to dělají. Praktické kapitoly jsou již mnohem lepší. Soudě podle výsledků experimentů se studentovi podařilo implementovat části MP3 dle zadání (kromě kódování stereosignálu). Technický popis částí programů je srozumitelný a odkazuje se do teoretické části. Grafické uživatelské rozhraní je přívětivé a srozumitelné, oceňuji animovanou podobu iterativní bitové alokace v kritických pásmech. Drobnější poznámky: * U PEMO-Q: není jasné, kterou implementaci student použil. V Úvodu cituje [12], ale později jen [15]. V příloze PEMO-Q není k nalezení. * Přehled kbps pro různé streamovací služby je v pořádku, ale chybí mi jakýkoliv komentář k těmto faktům. Nebo například rozbor, jaké jsou v dnešní době dostupné rychlosti připojení na různých zařízeních a pro různé typy sítí – tedy, např. nakolik je reálné provozovat např. Deezer HiFi s požadovanými 5.000 kbps. * FFT není možné aplikovat na nekonečný signál (str. 18) * Legenda v grafu na obr. 1.4 je špatně. * Student systematicky nedělá čárky před slovy: který, jehož, zatímco, kde… * Bohužel v kap. 3 student zaměňuje pojmy kodér a kodek, což by se u odborníka na tuto oblast nemělo stávat. * Pojem rekvantizace je podle mého názoru špatně, pojem vystihující podstatu operace je DEKVANTIZACE. * V experimentální části chybí zmínka o vzorkovacím kmitočtu testovacích skladeb. Dále skladby nejsou v elektronické příloze dostupné, tudíž čtenář nemá šanci ověřit studentovy výsledky. * Seznam literatury je formálně velmi špatně zpracován. * Nekonzistence proměnných (jako příklad, x je jednou jako časový signál, podruhé jako spektrální vzorek)

Navrhovaná známka
C
Body
75

Otázky

eVSKP id 133459