• čeština
    • English
    • русский
  • English 
    • čeština
    • English
    • русский
  • Login
View Item 
  •   Repository Home
  • Závěrečné práce
  • diplomové práce
  • Fakulta elektrotechniky a komunikačních technologií
  • 2020
  • View Item
  •   Repository Home
  • Závěrečné práce
  • diplomové práce
  • Fakulta elektrotechniky a komunikačních technologií
  • 2020
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Odhad přesnosti řečových technologií na základě měření signálové kvality a obsahové bohatosti audia

Estimation of accuracy of speech technologies based on signal quality and audio content richness

Thumbnail
View/Open
appendix-1.zip (1.859Mb)
final-thesis.pdf (7.265Mb)
review_126747.html (5.943Kb)
Author
Nezval, Jiří
Advisor
Schwarz, Petr
Referee
Smital, Lukáš
Grade
C
Altmetrics
Metadata
Show full item record
Abstract
Práce se zabývá teoretickým rozborem vzniku řeči, představuje možnosti využití řečových technologií a vysvětluje současný přístup k fonetickému přepisu řečových nahrávek. Jsou v ní popsány metriky hodnocení kvality audionahrávek, které rozdělujeme do dvou oddělených skupin. První skupinou jsou metriky signálové kvality, druhou metriky obsahové bohatosti. Prvním cílem praktické části je poté vytvořit statistický model pro predikci přesnosti strojového přepisu řečové nahrávky na základě měření její kvality. Druhým cílem je posoudit, které dílčí metriky jsou pro predikci přesnosti strojového přepisu nejdůležitější.
 
This thesis discusses theoretical analysis of the origin of speech, introduces applications of speech technologies and explains the contemporary approach to phonetical transcription of speech recordings. Furthermore, it describes the metrics of audio recordings quality assessment, which is split into two discrete classes. The first one groups signal quality metrics, while the other one groups content richness metrics. The first goal of the practical section is to create a statistical model for accuracy prediction of machine transcription of speech recordings based on a measurement of their quality. The second goal is to evaluate which partial metrics are the most essential for accuracy prediction of machine transcription.
 
Keywords
řeč, řečové technologie, fonetický přepis, signálová kvalita, obsahová bohatost, predikce přesnosti strojového přepisu, regrese, speech, speech technologies, phonetic transcription, signal quality, content richness, accuracy of automatic transcription, regression
Language
čeština (Czech)
Study brunch
Biomedicínské a ekologické inženýrství
Composition of Committee
doc. Ing. Radim Kolář, Ph.D. (předseda) Ing. Martin Mézl, Ph.D. (místopředseda) Ing. Lukáš Smital, Ph.D. (člen) Ing. Vratislav Čmiel, Ph.D. (člen) Ing. Jiří Chmelík (člen)
Date of defence
2020-06-17
Process of defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Ing. Chmelík položil otázku na původ nahrávek a na metriky odhadu signálové kvality. Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.
Result of the defence
práce byla úspěšně obhájena
Persistent identifier
http://hdl.handle.net/11012/189309
Source
NEZVAL, J. Odhad přesnosti řečových technologií na základě měření signálové kvality a obsahové bohatosti audia [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2020.
Collections
  • 2020 [334]
Citace PRO

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV
 

 

Browse

All of repositoryCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Statistics

View Usage Statistics

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV