MOLDŘÍKOVÁ, Z. Metody potlačení šumu pro rozpoznávače řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2014.

Posudky

Posudek vedoucího

Odstrčilík, Jan

Studentka se ve své práci zabývala aplikací metod potlačení šumu v rozpoznávačích řeči. Přímou aplikací by mělo být případné využití navržených metod v rozpoznávačích v kokpitu dopravních letadel. Studentka svou práci vypracovávala především na pracovišti zadavatele projektu, firmy Honeywell. Řešení práce po odborné stránce tak bylo do značné míry určováno konzultanty z této firmy. V první fázi se studentka zaměřila na studium potřebné literatury z oblasti zpracování řečových signálů a především metod potlačení nežádoucího šumu. Studentka si z dostupné literatury nastudovala nejvíce používané metody potlačení šumové složky řečového signálu a ty v práci teoreticky popsala. K této části mám výtku, a sice že studentka mohla používané metody porovnat více z aplikačního hlediska, s ohledem právě na rozpoznávání řeči. V další fázi studentka vybranou metodu implementovala v prostředí MATLAB a vyhodnotila na databázi řečových nahrávek, kterou vytvořila na pracovišti zadavatele v rámci řešení této práce. Databáze i jednotlivé signály jsou v práci popsány. Z mého pohledu však mohlo být popisu databáze věnováno trochu více prostoru. Chybí mi zejména analýza šumové složky nahraných signálů a celkově popis charakteru rušení mohl být o něco obsáhlejší. Implementována metoda byla vyhodnocena prostřednictvím zmíněné databáze a výsledky jsou v práci diskutovány. Na první pohled se zdá, že navržená metoda nepřináší významné zlepšení. Nicméně z pohledu zadání firmy Honeywell jsou dosažené výsledky zřejmě akceptovatelné. Studentka byla v průběhu řešení práce velmi aktivní. I když práci řešila především na firemním pracovišti, docházela i na konzultace, kde mě pravidelně informovala o svém postupu. K řešení dílčích problému, zejména problémů spojených s implementací metod přistupovala kreativně. Studentka svou práci úspěšně prezentovala i na konferenci STUDENT EEICT 2014. Zadání práce považuji za splněné a práci doporučuji k obhajobě. Dosažené výsledky a celkový přístup studentky k řešení práce hodnotím stupněm B/80b.

Navrhovaná známka
B
Body
80

Posudek oponenta

Smital, Lukáš

Diplomová práce zkoumá možnosti redukce šumu jako předzpracování pro rozpoznavače řeči při komunikaci v kokpitu letícího dopravního letadla. Studentka navrhla a realizovala metodu spektrálního odečítání, kterou porovnává s dalšími modifikacemi této metody i se dvěma variantami wienerova filtru pocházejícími z tooboxu Voicebox. Metody jsou hodnoceny na základě procenta úspěšnosti rozpoznaných frází profesionálním softwarem (což považuji za směrodatné), dále podle blíže nespecifikovaného skóre a podle dosaženého SNR. Výsledky bohužel ukazují, že jakékoli předzpracování nevede ke zlepšení účinnosti detekce, spíše k jeho zhoršení. Výjimku tvoří předzpracování nahrávek pořízených tabletem s vysokým obsahem rušení, kde je ale úspěšnost rozpoznavače na 4 %, po filtraci maximálně na 24 % (viz. otázka). V práci chybí podrobnější rozbor šumové a užitečné složky, jejich spekter a jejich vzájemného překrytí a vůbec hlubší rozbor celého problému. Nosná část práce tedy zahrnuje především vytvoření databází nahrávek v různém prostředí a různými záznamovými zařízeními a jejich filtrace různými metodami. Vyhodnocení mi přijde místy nepřehledné a s překlepy, např. tabulky popisované v kapitole 7.2 se objevují až v kapitole 7.3. Z formálního hlediska je práce na dobré úrovni.

Navrhovaná známka
C
Body
70

Otázky

eVSKP id 73097