Odhad formantových kmitočtů pomocí strojového učení

but.committeeprof. Ing. Zdeněk Smékal, CSc. (předseda) doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda) Ing. Jiří Přinosil, Ph.D. (člen) Ing. František Rund, Ph.D. (člen) MgA. Mgr. Ondřej Jirásek, Ph.D. (člen) Mgr. Tomáš Staudek, Ph.D. (člen)cs
but.defenceStudent obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta. Jakým způsobem jste oddělila znělé a neznělé pasáže ve své práci? Interpretujte obrázek ve své prezentaci (detekce formantů).cs
but.jazykslovenština (Slovak)
but.programAudio inženýrstvícs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMekyska, Jiřísk
dc.contributor.authorKáčerová, Erikask
dc.contributor.refereeGaláž, Zoltánsk
dc.date.accessioned2019-06-14T11:40:25Z
dc.date.available2019-06-14T11:40:25Z
dc.date.created2019cs
dc.description.abstractDiplomová práca sa zoberá problematikou odhadu formantových kmitočtov. V prostredí Matlab je vytvorený systém, ktorý generuje databázu referenčných hodnôt prvých troch formantových kmitočtov z nahrávok ľudskej reči. Pritom sú využité softvéry Praat a WaveSurfer(Snack). Zo zvukových súborov sú extrahované lineárne predikčné koeficienty a melovské kepstrálne koeficienty. Vytvorená databáza je použitá k trénovaniu modelu neurónovej siete. Model je v závere testovaný.sk
dc.description.abstractThis Master's thesis deals with the issue of formant extraction. A system of scripts in Matlab interface is created to generate values of the first three formant frequencies from speech recordings with the use of Praat and Snack(WaveSurfer). Mel Frequency Cepstral Coefficients and Linear Predictive Coefficients are extracted from the audio files in order to be added to the database. This database is then used to train a neural network. Finally, the designed neural network is tested.en
dc.description.markCcs
dc.identifier.citationKÁČEROVÁ, E. Odhad formantových kmitočtů pomocí strojového učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2019.cs
dc.identifier.other118151cs
dc.identifier.urihttp://hdl.handle.net/11012/177564
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectformantsk
dc.subjectformantový kmitočetsk
dc.subjectLPCsk
dc.subjectMatlabsk
dc.subjectMFCCsk
dc.subjectneurónové sietesk
dc.subjectPraatsk
dc.subjectrečsk
dc.subjectspracovanie rečisk
dc.subjectstrojové učeniesk
dc.subjectFormanten
dc.subjectFormant Frequenciesen
dc.subjectLPCen
dc.subjectMatlaben
dc.subjectMFCCen
dc.subjectNeural Networksen
dc.subjectPraaten
dc.subjectSpeechen
dc.subjectSpeech Processingen
dc.subjectMachine Learningen
dc.titleOdhad formantových kmitočtů pomocí strojového učenísk
dc.title.alternativeEstimation of formant frequencies using machine learningen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2019-06-04cs
dcterms.modified2019-06-06-13:19:37cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid118151en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 23:07:21en
sync.item.modts2021.11.12 22:37:22en
thesis.disciplineAudio inženýrstvícs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.41 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
32.47 KB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_118151.html
Size:
5.31 KB
Format:
Hypertext Markup Language
Description:
review_118151.html
Collections