Topic Identification from Spoken TED-Talks

but.committeedoc. Ing. Richard Růžička, Ph.D., MBA (předseda) doc. Ing. Ondřej Ryšavý, Ph.D. (místopředseda) Ing. Jaroslav Dytrych, Ph.D. (člen) Ing. Bohuslav Křena, Ph.D. (člen) Ing. Michal Španěl, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: * How to describe in a few sentences the main components of the ASR system? * How to analyze the results of the topic identification system?Is there any comparable results already published on similar corpus? * Why the results from the ASR-TID system are sometimes better than the text based TID system.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKesiraju, Santoshen
dc.contributor.authorVašš, Adamen
dc.contributor.refereeOndel, Lucas Antoine Francoisen
dc.date.accessioned2020-05-11T03:17:52Z
dc.date.available2020-05-11T03:17:52Z
dc.date.created2019cs
dc.description.abstractTáto práca sa zaoberá problémom spracovania prirodzeného jazyka a následnej klasifikácie. Použité systémy boli modelované na TED-LIUM korpuse. Systém automatického spracovania jazyka bol modelovaný s použitím sady nástrojov Kaldi. Vo výsledku bol dosiahnutý WER s hodnotou 16.6%. Problém klasifikácie textu bol adresovaný s pomocou metód na lineárnu klasifikáciu, konkrétne Multinomial Naive Bayes a Linear Support Vector Machines, kde druhá technika dosiahla vyššiu presnosť klasifikácie.en
dc.description.abstractThis thesis deals with the problems of language recognition and topic classification, using TED-LIUM corpus to train both the ASR and classification models. The ASR system is built using the Kaldi toolkit, achieving the WER of 16.6%. The classification problem is addressed using linear classification methods, specifically Multinomial Naive Bayes and Linear Support Vector Machines, the latter method achieving higher topic classification accuracy.cs
dc.description.markCcs
dc.identifier.citationVAŠŠ, A. Topic Identification from Spoken TED-Talks [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other128147cs
dc.identifier.urihttp://hdl.handle.net/11012/187233
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectTEDen
dc.subjecttalksen
dc.subjectidentifikácia témen
dc.subjectstrojové učenieen
dc.subjectklasifikáciaen
dc.subjecttranskripciaen
dc.subjectlineárna klasifikáciaen
dc.subjectKaldien
dc.subjectsupport vector machinesen
dc.subjectakustický modelen
dc.subjectlingvistický modelen
dc.subjectTED-LIUMen
dc.subjectASRen
dc.subjectTEDcs
dc.subjecttalkscs
dc.subjecttopic identificationcs
dc.subjectmachine learningcs
dc.subjectclassificationcs
dc.subjecttranscriptioncs
dc.subjectlinear classificationcs
dc.subjectKaldics
dc.subjectsupport vector machinescs
dc.subjectacoustic modelingcs
dc.subjectlanguage modelingcs
dc.subjectTED-LIUMcs
dc.subjectASRcs
dc.titleTopic Identification from Spoken TED-Talksen
dc.title.alternativeTopic Identification from Spoken TED-Talkscs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2019-08-29cs
dcterms.modified2020-05-10-16:13:38cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid128147en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 18:59:44en
sync.item.modts2021.11.12 17:53:03en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.33 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-22509_v.pdf
Size:
85.65 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-22509_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-22509_o.pdf
Size:
86.22 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-22509_o.pdf
Loading...
Thumbnail Image
Name:
review_128147.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
review_128147.html
Collections