Odhad přesnosti řečových technologií na základě měření signálové kvality a obsahové bohatosti audia
Estimation of accuracy of speech technologies based on signal quality and audio content richness
Author
Advisor
Schwarz, PetrReferee
Smital, LukášGrade
CAltmetrics
Metadata
Show full item recordAbstract
Práce se zabývá teoretickým rozborem vzniku řeči, představuje možnosti využití řečových technologií a vysvětluje současný přístup k fonetickému přepisu řečových nahrávek. Jsou v ní popsány metriky hodnocení kvality audionahrávek, které rozdělujeme do dvou oddělených skupin. První skupinou jsou metriky signálové kvality, druhou metriky obsahové bohatosti. Prvním cílem praktické části je poté vytvořit statistický model pro predikci přesnosti strojového přepisu řečové nahrávky na základě měření její kvality. Druhým cílem je posoudit, které dílčí metriky jsou pro predikci přesnosti strojového přepisu nejdůležitější. This thesis discusses theoretical analysis of the origin of speech, introduces applications of speech technologies and explains the contemporary approach to phonetical transcription of speech recordings. Furthermore, it describes the metrics of audio recordings quality assessment, which is split into two discrete classes. The first one groups signal quality metrics, while the other one groups content richness metrics. The first goal of the practical section is to create a statistical model for accuracy prediction of machine transcription of speech recordings based on a measurement of their quality. The second goal is to evaluate which partial metrics are the most essential for accuracy prediction of machine transcription.
Keywords
řeč, řečové technologie, fonetický přepis, signálová kvalita, obsahová bohatost, predikce přesnosti strojového přepisu, regrese, speech, speech technologies, phonetic transcription, signal quality, content richness, accuracy of automatic transcription, regressionLanguage
čeština (Czech)Study brunch
Biomedicínské a ekologické inženýrstvíComposition of Committee
doc. Ing. Radim Kolář, Ph.D. (předseda) Ing. Martin Mézl, Ph.D. (místopředseda) Ing. Lukáš Smital, Ph.D. (člen) Ing. Vratislav Čmiel, Ph.D. (člen) Ing. Jiří Chmelík (člen)Date of defence
2020-06-17Process of defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Chmelík položil otázku na původ nahrávek a na metriky odhadu signálové kvality. Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/189309Source
NEZVAL, J. Odhad přesnosti řečových technologií na základě měření signálové kvality a obsahové bohatosti audia [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2020.Collections
- 2020 [334]