Odhad přesnosti řečových technologií na základě měření signálové kvality a obsahové bohatosti audia

Loading...
Thumbnail Image
Date
ORCID
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Práce se zabývá teoretickým rozborem vzniku řeči, představuje možnosti využití řečových technologií a vysvětluje současný přístup k fonetickému přepisu řečových nahrávek. Jsou v ní popsány metriky hodnocení kvality audionahrávek, které rozdělujeme do dvou oddělených skupin. První skupinou jsou metriky signálové kvality, druhou metriky obsahové bohatosti. Prvním cílem praktické části je poté vytvořit statistický model pro predikci přesnosti strojového přepisu řečové nahrávky na základě měření její kvality. Druhým cílem je posoudit, které dílčí metriky jsou pro predikci přesnosti strojového přepisu nejdůležitější.
This thesis discusses theoretical analysis of the origin of speech, introduces applications of speech technologies and explains the contemporary approach to phonetical transcription of speech recordings. Furthermore, it describes the metrics of audio recordings quality assessment, which is split into two discrete classes. The first one groups signal quality metrics, while the other one groups content richness metrics. The first goal of the practical section is to create a statistical model for accuracy prediction of machine transcription of speech recordings based on a measurement of their quality. The second goal is to evaluate which partial metrics are the most essential for accuracy prediction of machine transcription.
Description
Citation
NEZVAL, J. Odhad přesnosti řečových technologií na základě měření signálové kvality a obsahové bohatosti audia [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2020.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Biomedicínské a ekologické inženýrství
Comittee
doc. Ing. Radim Kolář, Ph.D. (předseda) Ing. Martin Mézl, Ph.D. (místopředseda) Ing. Lukáš Smital, Ph.D. (člen) Ing. Vratislav Čmiel, Ph.D. (člen) Ing. Jiří Chmelík, Ph.D. (člen)
Date of acceptance
2020-06-17
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Chmelík položil otázku na původ nahrávek a na metriky odhadu signálové kvality. Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO