STRUHAŘ, M. Detekce chybné výslovnosti v mluvené řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2008.

Posudky

Posudek vedoucího

Sysel, Petr

Diplomová práce splňuje zadání a obsahuje všechny formální části včetně přílohy se zdrojovými kódy a nahrávkami použitými pro testování implementovaných algoritmů. Student celou dobu pracoval samostatně a aktivně. Samostatně si vyhledal i většinu informačních zdrojů, ze kterých potom čerpal při řešení diplomové práce. Bohužel u některých položek v seznamu literatury zbytečně neuvedl všechny povinné položky citace podle normy. Řada skriptů pro výpočet velkého množství parametrů řečového signálu (včetně kepstrálních koeficientů, koeficientů mel-spektra, atd.) bude využita i při další práci v oblasti zpracování řeči. Nad rámec zadání vytvořil i skripty pro fonetický přepis textu. S využitím těchto skriptů student navrhl systém pro rozpoznávání řeči, který poté rozšířil i o detekci chybné výslovnosti. Testování skriptů provedl na velkém množství nahrávek, které musel sám označkovat na jednotlivé slova a hlásky. Nižší účinnost rozpoznávače je způsobena neznalostí hranic fonémů. Algoritmus segmentace řeči na fonémy již nebyl implementován z časových důvodů vzhledem k rozsahu práce. Přesto je diplomová práce na výborné úrovni a proto ji doporučuji k obhajobě.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění zadání A 50/50
Aktivita během řešení a zpracování práce (práce s literaturou, využívání konzultací, atd.) A 20/20
Využití literatury A 10/10
Formální zpracování práce A 18/20
Navrhovaná známka
A
Body
98

Posudek oponenta

Rajmic, Pavel

Diplomová práce Michala Struhaře pojednává o výběru vhodných parametrizací řeči a metod jejich zpracování pro účely detekce chybné výslovnosti. Práce je vhodně členěna na kapitoly a jejich části, počet stran je nadprůměrný a obsah textu je na velmi nadstandardní úrovni. Práce je psána přehledně a srozumitelně, z jazykové stránky je práce v pořádku až na několik překlepů, nesprávné použití tvrdého a měkkého "i" a další gramatické nedokonalosti. Grafické a typografické zpracování je velmi zdařilé. Vypracování do značné míry překračuje zadání práce. Student v práci projevil fundovaný rozhled v problematice zpracování řečového signálu, oproti zadání nastudoval a použil vybrané pasáže z fonetiky, dále metody borcení časové osy, umělé neuronové sítě apod. Na přiloženém CD je k dispozici hlavní produkt DP, obsáhlý kód pro MATLAB implementující algoritmy z textové části. Program je funkční a zdařilý, oceňuji uvedení demonstračních ukázek použití. Vytýkám studentovi částečně práci s literaturou, a to toho důvodu, že v kapitole první málo cituje použité zdroje a v kapitole čtvrté necituje vůbec, ačkoliv rozhodně není autorem popisované metody DTW. Vztahy (3.18) až (3.20) by bylo účinnější vyjádřit grafem. V rovnici (7.2) je konfliktně použit symbol indexu k. Na str. 23 se dočteme, že "Hodnoty funkce krátkodobé energie poskytují pro každý segment informaci o celkové energii v segmentu. Jedním z nedostatků této charakteristiky je její značná citlivost na velké změny úrovně signálu." Domnívám se, že to je naopak požadovaná vlastnost této funkce. Celkově práci hodnotím vysoce i přesto, že účinnost výsledné metody není ohromující.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků zadání A 20/20
Odborná úroveň práce A 50/50
Interpretace výsledků a jejich diskuse A 20/20
Formální zpracování práce B 8/10
Navrhovaná známka
A
Body
98

Otázky

eVSKP id 14247