Porovnání analýzy řečového signálu v závislosti na věku a pohlaví mluvčího

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Obsah této práce je zaměřen na analýzu věku a pohlaví. Dále pak byli zkoumány vhodnosti příznaků a vhodnost jejich použití při klasifikaci mluvčích. Je v ní pojednáno o základní teorii řečového signálu a problematice zobrazení a zpracování řeči. Je zde popsán volně dostupný program Praat, kterým se používá pro řečovou analýzu. Zaměřili jsme se na suprasegmentální příznaky řeči. Dále je zde popsána teorie příznaků které byly pro práci zvoleny. Prvním z kroků v této práci bylo získání dostatečného počtu promluv (nahráváním) od mluvčích různého věku a pohlaví. Řečový korpus je poměrně obsáhlý. Mluvčí byli rozděleni do šesti věkových skupin. Dále byly nahrávky zpracovány v programu Praat. Průměrné hodnoty byly vyneseny do tabulek a sloupcových grafů pro větší přehlednost. Dále bylo vybráno dvanáct nejvhodnějších příznaků podle kritéria kvality. S nimi poté byla provedena analýza zvolených příznaků pro automatické rozpoznávání pohlaví a věku. Příznaky byly při testování po jednom ubírány. Jako klasifikátor pro rozpoznávání byla zvolena neuronová sít. Pro práci se sítí byl zvolen Neural Network Toolbox v programu Matlab. Vytvořené sítě byly použity pro klasifikaci mluvčích na základě věku a pohlaví. Výsledky byly rozebrány v závěru práce.
This thesis deals with analysis of speech signal in dependence on the gender and the age of the speaker. We tried to investigate through the features to find the best set for the automatic classification of speakers. It also contains a brief discussion about the speech signal and its characteristics. We used a program called Praat for the speech analysis purpose. This program is also described in this work. We mainly focused on the suprasegmental features of speech. Our first step was to make our own speech corpus which should contain speech records from speakers with various age and gender. We made the analysis using Praat and reported it within this thesis. For the automatic classification purpose, twelve features were selected basing on there quality criteria and used with a neural network to classify the speakers to classes with different age and gender. As it was mentioned, a neural network was used as a classifier. We used “Neural Network Toolbox” in the Matlab program to create and train our networks.
Description
Citation
BÁŇA, J. Porovnání analýzy řečového signálu v závislosti na věku a pohlaví mluvčího [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2008.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Teleinformatika
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Martin Vondra, Ph.D. (místopředseda) Ing. Jan Vlach, Ph.D. (člen) Ing. Martin Plšek, Ph.D. (člen) Ing. Petr Kovář, Ph.D. (člen) Ing. Milan Šimek, Ph.D. (člen)
Date of acceptance
2008-06-18
Defence
1. Podle jakých kritérií byly vybrány testovací promluvy? 2. Vysvětlete pojmy: intenzita, hladina intenzity, hlasitost a hladina hlasitosti.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO