Show simple item record

Intersession Variability Compensation in Language and Speaker Identification

dc.contributor.advisorMatějka, Pavelen
dc.contributor.authorHubeika, Valiantsinaen
dc.date.accessioned2018-05-17T22:20:51Z
dc.date.available2018-05-17T22:20:51Z
dc.date.created2008cs
dc.identifier.citationHUBEIKA, V. Intersession Variability Compensation in Language and Speaker Identification [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2008.cs
dc.identifier.other25426cs
dc.identifier.urihttp://hdl.handle.net/11012/52674
dc.description.abstractVariabilita kanálu a hovoru je velmi důležitým problémem v úloze rozpoznávání mluvčího. V současné době je ve velkém množství vědeckých článků uvedeno několik technik pro kompenzaci vlivu kanálu. Kompenzace vlivu kanálu může být implementována jak v doméně modelu, tak i v doménách příznaků i skóre. Relativně nová výkoná technika je takzvaná eigenchannel adaptace pro GMM (Gaussian Mixture Models). Mevýhodou této metody je nemožnost její aplikace na jiné klasifikátory, jako napřílad takzvané SVM (Support Vector Machines), GMM s různým počtem Gausových komponent nebo v rozpoznávání řeči s použitím skrytých markovových modelů (HMM). Řešením může být aproximace této metody, eigenchannel adaptace v doméně příznaků. Obě tyto techniky, eigenchannel adaptace v doméně modelu a doméně příznaků v systémech rozpoznávání mluvčího, jsou uvedeny v této práci. Po dosažení dobrých výsledků v rozpoznávání mluvčího, byl přínos těchto technik zkoumán pro akustický systém rozpoznávání jazyka zahrnující 14 jazyků. V této úloze má nežádoucí vliv nejen variabilita kanálu, ale i variabilita mluvčího. Výsledky jsou prezentovány na datech definovaných pro evaluaci rozpoznávání mluvčího z roku 2006 a evaluaci rozpoznávání jazyka v roce 2007, obě organizované Amerických Národním Institutem pro Standard a Technologie (NIST)en
dc.description.abstractVaribiality in the channel and session is an important issue in the text-independent speaker recognition task. To date, several techniques providing channel and session variability compensation were introduced in a number of scientic papers. Such implementation can be done in feature, model and score domain. Relatively new and powerful approach to remove channel distortion is so-called eigenchannel adaptation for Gaussian Mixture Models (GMM). The drawback of the technique is that it is not applicable in its original implementation to different types of classifiers, eg. Support Vector Machines (SVM), GMM with different number of Gaussians or in speech recognition task using Hidden Markov Models (HMM). The solution can be the approximation of the technique, eigenchannel adaptation in feature domain. Both, the original eigenchannel adaptation and eigenchannel adaptation on features in task of speaker recognition are presented. After achieving good results in speaker recognition, contribution of the same techniques was examined in acoustic language identification system with $14$ languages. In this task undesired factors are channel and speaker variability. Presented results are presented on the NIST Speaker Recognition Evaluation 2006 data and NIST Language Recognition Evaluation 2007 data.cs
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectRozpoznánání mluvčíhoen
dc.subjectrozpoznávání jazykaen
dc.subjectakustický systémen
dc.subjectvariabilita kanáluen
dc.subjectvariabilita mluvčíhoen
dc.subjectkompenzace kanáluen
dc.subjecteigenchannel adaptaceen
dc.subjectSpeaker identificationcs
dc.subjectlanguage identificationcs
dc.subjectaccoustic systemcs
dc.subjectsession variabilitycs
dc.subjectinter-speaker variabilitycs
dc.subjectchannel compensationcs
dc.subjecteigenchannel adaptationcs
dc.subjecteigenfeaturescs
dc.titleIntersession Variability Compensation in Language and Speaker Identificationen
dc.title.alternativeIntersession Variability Compensation in Language and Speaker Identificationcs
dc.typeTextcs
dcterms.dateAccepted2008-06-16cs
dcterms.modified2014-07-17-13:53:47cs
thesis.disciplinePočítačová grafika a multimédiacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
sync.item.dbid25426en
sync.item.dbtypeZPen
sync.item.insts2019.06.21 08:36:15en
sync.item.modts2019.05.18 00:54:26en
dc.contributor.refereeBurget, Lukášen
dc.description.markAcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record