KUFA, T. Rozpoznáváni standardních PILOT-CONTROLLER řídicích povelů v hlasové podobě [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2009.

Posudky

Posudek vedoucího

Honzík, Petr

Student Bc. Tomáš Kufa vypracoval diplomovou práci zadanou firmou Honeywell, divize avioniky. Cílem práce bylo rozpoznání povelů letových dispečerů pro potřeby bezpilotních letadel. Zadání bylo mimořádně náročné nejen svým rozsahem, ale také požadovanými odbornými znalostmi v oblasti rozpoznání řeči, která není hlavní doménou studentova pracoviště. Student prokázal schopnost samostatné práce, v uvedené oblasti se dobře zorientoval, aktivně konzultoval nejen se školitelem a konzultanty ve firmě Honeywell, ale také např. na fakultě informatiky. Na reálných zvukových záznamech provedl srovnání dvou metod a prakticky ověřil správnost jím navržené koncepce řešení. Navrhuji hodnocení 95 bodů / A / výborně.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění zadání A 45/50
Aktivita během řešení a zpracování práce (práce s literaturou, využívání konzultací, atd.) A 20/20
Formální zpracování práce A 20/20
Využití literatury A 10/10
Navrhovaná známka
A
Body
95

Posudek oponenta

Polách, Petr

Diplomant vypracoval text zabývající se srovnáním dvou metod pro analýzu řečového signálu použitelných pro automatické vyhodnocování letecké komunikace. Vzhledem k tomu, že se jedná o látku v běžných kurzech našeho oboru neprobíranou, jde o náročnější zadání. Diplomant v předložené práci stručně diskutuje všechny podstatné aspekty spojené se zpracováním řečového signálu od jeho digitalizace přes filtraci, segmentaci až po významovou analýzu. Práce je vhodně strukturována a formálně jinak dobře zpracována. Často jsem však postrádal odkazy na citovanou literaturu, které by vzhledem na spíš stručnost textu (celá problematika na cca 30 stranách) často byly na místě. V kap. 3.2. např. autor zmiňuje několik kritérií pro vyhodnocení úrovně šumu včetně jejich vhodnosti pro tu kterou aplikaci. Není však známo, odkud autor čerpal. Podobně pak v kap. 3.4., která se zabývá segmentací (již autor přikládá velký význam), udává, že nejlépe se pro rozpoznávání Air Traffic Control povelů hodí segmentace po celých slovech. Také není uvedeno odkud tato informace přichází. Diplomant implementoval a oživil rozpoznávání povelových slov metodou dynamického borcení časové osy a také oživil modul pro analýzu řeči pomocí skrytých markovových řetězců. Efektivnost obou přístupů v souladu se zadáním srovnal. Zadání tedy považuji za splněné v celém rozsahu. Správně diplomant vyhodnocuje získané výsledky, včetně závěru o tom, nakolik je možné vůbec metodu borcení časové osy v předkládaném smyslu považovat za použitelnou vůbec. Diplomant zcela správně upozorňuje v závěru na to, že úspěšnost této metody se blíží srovnávaným markovovým řetězcům pouze tehdy, když je ve slovníku zahrnut hlas právě analyzovaného mluvčího. Vzhledem k uvedenému doporučuji diplomovou práci k obhajobě a navrhuji hodnotit stupněm Výborně.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků zadání A 20/20
Odborná úroveň práce B 42/50
Interpretace výsledků a jejich diskuse A 20/20
Formální zpracování práce B 8/10
Navrhovaná známka
A
Body
90

Otázky

eVSKP id 22292