Segmentace mluvčích s využitím statistických metod klasifikace

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
V práci sú podrobne vysvetlené a rozobraté pojmy reč a prozódia, ktoré predstavujú teoretické východiská pre segmentáciu hovoriacich. Rovnako je opísaný multimediálny anotačný nástroj Elan, použitý pre značkovanie databázy. Teoretická časť ďalej zdôrazňuje príznaky často používané pre spracovanie reči ako MFCC, PLP a LPC. Zaoberá sa najpopulárnejšími metódami segmentácie hovoriacich, z ktorých niektoré i popisuje. Praktická časť sa venuje implementácií metódy Bayesovho informačného kritéria do systému pre automatickú segmentáciu hovoriacich. Pre automatickú segmentáciu hovoriacich boli postupne použité viaceré príznaky. Výsledky testov boli vyhodnotené grafickou metódou ROC a jej kvantitatívnymi parametrami. Ako najvhodnejšie pre segmentáciu hovoriacich boli stanovené príznaky MFCC a HFCC.
The thesis discusses in detail some concepts of speech and prosody that can contribute to build a speech corpus for the speaker segmentation purpose. Moreover, the Elan multimedia annotator used for labeling is described. The theoretical part highlights some frequently used speech features such as MFCC, PLP and LPC and deals with currently most popular speech segmentation methods. Some classification algorithms are also mentioned. The practical part describes implementation of Bayesian information criterium algorithm in system for automatic speaker segmentation. For classification of speaker change point in speech, were used different speech features. The results of tests were evaluated by the graphic method of receiver operating characteristic (ROC) and his quantitative indices. As the best speech features for this system were provided MFCC and HFCC.
Description
Citation
ADAMSKÝ, A. Segmentace mluvčích s využitím statistických metod klasifikace [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2011.
Document type
Document version
Date of access to the full text
Language of document
sk
Study field
Telekomunikační a informační technika
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Robert Vích, DrSc. (místopředseda) doc. Ing. Otto Dostál, CSc. (člen) Ing. Jaromír Hrad, Ph.D. (člen) Ing. Jan Karásek, Ph.D. (člen) Ing. Hicham Atassi, Ph.D. (člen) Ing. Peter Stančík (člen)
Date of acceptance
2011-06-08
Defence
Vysvětlete pojem vzálenost od bodu [0,1] a jeho vliv na segmentaci signálu. - Pojem byl vysvětlen pomocí vzorce. Existuje vzájemná vazba mezi chybně segmentovanými úseky řeči napříč použitými příznaky? Jaký byl použit vzorkovací kmitočet?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO