Odhad základní frekvence řečového signálu

Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Bakalářská práce je zaměřena na studium algoritmů zabývajících se odhadem základní frekvence řečového signálu. První část je úvodem do problematiky řečového signálu a naznačuje co bude jádrem práce. Ve druhé části je vysvětlen charakter řečového signálu, proces jeho tvorby člověkem a modely na vytváření řeči. Kapitola č. 3 se zbývá zpracováním akustických signálů, do nějž patří předzpracování, segmentace a aplikace Hammingova okénka na samotný akustický řečový signál. Další kapitola popisuje základní frekvenci řečového signálu jako fyzikální veličinu a její odvození ze základní periody. Dále vznik základní frekvence v řečových orgánech, rozsah hodnot pro různé lidi, vlastnosti, které se sebou nese a nakonec možnosti jejího využití. Kapitola č. 5 se věnuje základním metodám na určení základní frekvence řeči v časové, frekvenční a kepstrální oblasti. Kapitola č. 6 obsahuje popis metod, jenž se využívají v případech, kdy je řečový signál znehodnocen šumem. V následující části je popsán návrh a realizaci vybraného algoritmu. Dále jsou uvedeny výsledky jenž byly dosaženy tímto algoritmem a jsou porovnány s výsledky obyčejné metody autokorelace. Závěrečná kapitola shrnuje celou práci a je v ní pojednáno o pokračování, rozšíření, či zdokonalení algoritmu.
The Bachelor thesis focuses on algorithms with respect to estimation of fundamental speech frequency. First part is introduce to the questions of speech signals and the thesis at this point gives a clue what the core is going to be about. In the second part the nature of speech signal is explained, as well as the process of it’s creation by a person and models for speech generation. In the chapter 3 processing of acoustic signals are described, where pre-processing, segmentation and application of Hamming window on the same acoustic speech signal are included. The next chapter reports on pitch speech frequency signal as a physical magnitude and it's derivation from the pitch period. Furthermore describes, fundamental frequency creation in speech organs, scale range for different people, properties that carries and finally possibilities of it’s usage. Chapter 5 deals with essential principles defining pitch speech frequency in time, frequency and cepstral domain. Chapter 6 contains description of principles, used in situations, where the speech signal is devalued by noise. In the next chapter author describes design and implementation of selected principle. Furthermore, author presents results that have been achieved with this specific principle and compares them to the results of ordinary autocorrelation principle. The final chapter summarises the thesis and discusses about possible further part, extension or improvement of the algorithm.
RÁČEK, T. Odhad základní frekvence řečového signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2008.
Document type
Document version
Date of access to the full text
Language of document
Study field
prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Martin Vondra, Ph.D. (místopředseda) Ing. Jan Vlach, Ph.D. (člen) Ing. Martin Plšek, Ph.D. (člen) Ing. Petr Kovář, Ph.D. (člen) Ing. Milan Šimek, Ph.D. (člen)
Date of acceptance
1. Vysvětlete metodu RASTA. 2. Proč ve funkci filterbank (filterbank.m) jsou na začátku vstupní parametry hned přepsány?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
Citace PRO