Show simple item record

Emotion Detection from Speech

dc.contributor.advisorMatějka, Pavelcs
dc.contributor.authorPopková, Annacs
dc.date.accessioned2020-06-23T09:02:27Z
dc.date.available2020-06-23T09:02:27Z
dc.date.created2016cs
dc.identifier.citationPOPKOVÁ, A. Odhad emocí řečníka z mluvené řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.cs
dc.identifier.other96478cs
dc.identifier.urihttp://hdl.handle.net/11012/62251
dc.identifier.urihttp://hdl.handle.net/11012/190047
dc.description.abstractTato bakalářská práce se zabývá výzkumem v oblasti rozpoznávání emocí z řeči a okrajově i z dalších modalit (video a fyziologické záznamy). Popisuje topologii systémů, které byly pro tento výzkum postaveny. Dále popisuje experimenty s těmito systémy vedoucí k optimálnímu předzpracování, trénování a po-zpracování dat. K výzkumu jsou použita data z evaluace AV+EC 2015, do níž byly zaslány výsledky fúzních systému produkujících nejpřesnější predikci. Nově jsou v oblasti rozpoznávání emocí z řeči vyzkoušeny Bottle-Neck příznaky. Jsou použity spolu s běžně používanými eGeMAPS příznaky ve fúzním systému rozpoznávající emoční dimenzi arousal. Emoční dimenze valence je pak rozpoznávána dvojicí video příznaků. Multi-task systém (rozpoznávající valenci i arousal) používající Bottle-Neck příznaky produkuje výslekdy pouze o 13 % relativně horší, než zmíněný fúzní systém, což apeluje hlavně na situace, kde jsou dostupná pouze audio data.cs
dc.description.abstractThis Bachelor Thesis deals with research in the field of emotion recognition mainly from speech and marginally from other modalities (video and physiological data). It closely describes the topology of the systems built specifically for the subject of this work. Moreover, it describes experiments leading to optimized pre-processing, regressor training and post-processing. Data used for these research origins from evaluation AV+EC 2015. Results of fusion systems producing the most precise prediction were sent to this evaluation. The Bottle-Neck features are newly tested and combined favorably with commonly used eGeMAPS features for the recognition of arousal. For valence, two kinds of video features are used. Muli-task system (recognizing both valence and arousal) using Bottle-Neck features produces competitive results and is only 13 % relatively behind the mentioned fusion system. This is especially appealing for applications where only audio is available.en
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectDetekce emocícs
dc.subjectaudiocs
dc.subjectfúzecs
dc.subjectkontextcs
dc.subjectBottle-Neck příznaky.cs
dc.subjectEmotion recognitionen
dc.subjectspeechen
dc.subjectfusionen
dc.subjectcontexten
dc.subjectBottle-Neck features.en
dc.titleOdhad emocí řečníka z mluvené řečics
dc.title.alternativeEmotion Detection from Speechen
dc.typeTextcs
dcterms.dateAccepted2016-06-15cs
dcterms.modified2020-05-10-16:12:36cs
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
sync.item.dbid96478en
sync.item.dbtypeZPen
sync.item.insts2020.06.23 11:02:27en
sync.item.modts2020.06.23 10:09:45en
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
dc.contributor.refereeFér, Radekcs
dc.description.markAcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
but.committeedoc. Dr. Ing. Jan Černocký (předseda) prof. Ing. Martin Drahanský, Ph.D. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) Ing. Michal Španěl, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm výborně (A). Otázky u obhajoby: - Jaké vás napadají jiné možnosti fúze multimodálních skóre s nespolehlivými výstupy (viz zmiňovaný nerozpoznaný obličej ve videu)? - Jaké jsou možné matoucí vlivy pro rozpoznávání (jazyk nahrávky, kanál atp.)? Počítá se s nimi v systému? - Jakým způsobem by se s pomocí vašeho systému mohl realizovat binární detektor jedné emoce, např. smutku?cs
but.resultpráce byla úspěšně obhájenacs
but.programInformační technologiecs
but.jazykčeština (Czech)


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record