Intersession Variability Compensation in Language and Speaker Identification

but.committeecs
but.defencecs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMatějka, Pavelen
dc.contributor.authorHubeika, Valiantsinaen
dc.contributor.refereeBurget, Lukášen
dc.date.accessioned2018-05-17T22:20:51Z
dc.date.available2018-05-17T22:20:51Z
dc.date.created2008cs
dc.description.abstractVariabilita kanálu a hovoru je velmi důležitým problémem v úloze rozpoznávání mluvčího. V současné době je ve velkém množství vědeckých článků uvedeno několik technik pro kompenzaci vlivu kanálu. Kompenzace vlivu kanálu může být implementována jak v doméně modelu, tak i v doménách příznaků i skóre. Relativně nová výkoná technika je takzvaná eigenchannel adaptace pro GMM (Gaussian Mixture Models). Mevýhodou této metody je nemožnost její aplikace na jiné klasifikátory, jako napřílad takzvané SVM (Support Vector Machines), GMM s různým počtem Gausových komponent nebo v rozpoznávání řeči s použitím skrytých markovových modelů (HMM). Řešením může být aproximace této metody, eigenchannel adaptace v doméně příznaků. Obě tyto techniky, eigenchannel adaptace v doméně modelu a doméně příznaků v systémech rozpoznávání mluvčího, jsou uvedeny v této práci. Po dosažení dobrých výsledků v rozpoznávání mluvčího, byl přínos těchto technik zkoumán pro akustický systém rozpoznávání jazyka zahrnující 14 jazyků. V této úloze má nežádoucí vliv nejen variabilita kanálu, ale i variabilita mluvčího. Výsledky jsou prezentovány na datech definovaných pro evaluaci rozpoznávání mluvčího z roku 2006 a evaluaci rozpoznávání jazyka v roce 2007, obě organizované Amerických Národním Institutem pro Standard a Technologie (NIST)en
dc.description.abstractVaribiality in the channel and session is an important issue in the text-independent speaker recognition task. To date, several techniques providing channel and session variability compensation were introduced in a number of scientic papers. Such implementation can be done in feature, model and score domain. Relatively new and powerful approach to remove channel distortion is so-called eigenchannel adaptation for Gaussian Mixture Models (GMM). The drawback of the technique is that it is not applicable in its original implementation to different types of classifiers, eg. Support Vector Machines (SVM), GMM with different number of Gaussians or in speech recognition task using Hidden Markov Models (HMM). The solution can be the approximation of the technique, eigenchannel adaptation in feature domain. Both, the original eigenchannel adaptation and eigenchannel adaptation on features in task of speaker recognition are presented. After achieving good results in speaker recognition, contribution of the same techniques was examined in acoustic language identification system with $14$ languages. In this task undesired factors are channel and speaker variability. Presented results are presented on the NIST Speaker Recognition Evaluation 2006 data and NIST Language Recognition Evaluation 2007 data.cs
dc.description.markAcs
dc.identifier.citationHUBEIKA, V. Intersession Variability Compensation in Language and Speaker Identification [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2008.cs
dc.identifier.other25426cs
dc.identifier.urihttp://hdl.handle.net/11012/52674
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectRozpoznánání mluvčíhoen
dc.subjectrozpoznávání jazykaen
dc.subjectakustický systémen
dc.subjectvariabilita kanáluen
dc.subjectvariabilita mluvčíhoen
dc.subjectkompenzace kanáluen
dc.subjecteigenchannel adaptaceen
dc.subjectSpeaker identificationcs
dc.subjectlanguage identificationcs
dc.subjectaccoustic systemcs
dc.subjectsession variabilitycs
dc.subjectinter-speaker variabilitycs
dc.subjectchannel compensationcs
dc.subjecteigenchannel adaptationcs
dc.subjecteigenfeaturescs
dc.titleIntersession Variability Compensation in Language and Speaker Identificationen
dc.title.alternativeIntersession Variability Compensation in Language and Speaker Identificationcs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2008-06-16cs
dcterms.modified2020-05-09-23:40:57cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid25426en
sync.item.dbtypeZPen
sync.item.insts2020.05.10 01:15:04en
sync.item.modts2020.05.10 00:12:23en
thesis.disciplinePočítačová grafika a multimédiacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
936.39 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_25426.html
Size:
1.47 KB
Format:
Hypertext Markup Language
Description:
review_25426.html
Collections