Rozpoznávání řeči pro vybrané jazyky

Schmitt, Jan

Rozpoznávání řeči pro vybrané jazyky

Mark

D

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

Abstract

Tato práce se zabývá rozpoznáváním spojité řeči pro trojici jazyků bulharštinu, chorvatštinu a švédštinu. Zpráva popisuje základy zpracování a rozpoznávání řeči, tvorbu akustických modelů pomocí skrytých Markovových modelů a směsi gaussovských rozložení a použití těchto technik pro rozpoznávání řeči v toolkitu Kaldi. Další součástí práce je postup přípravy dat pro toolkity pro rozpoznávání řeči HTK a Kaldi na základě dat z databáze GlobalPhone. V závěru jsou vytvořené modely otestovány pomocí testovacích dat a porovnány výsledky z jednotlivých modelů.
This bachelor's thesis deals with recognition of continues speech for three languages - Bulgarian, Croatian and Swedish. There are described basics of speech processing and recognition methods like acoustic modeling using hidden Markov models and gaussian mixture models. Another aim of this work is preparing data for those languages from GlobalPhone database, so they may be used with speech recognition toolkits Kaldi and HTK. With data prepared there are several models trained and tested using Kaldi toolkit.

Keywords

Rozpoznávání řeči, bulharština, chorvatština, švédština, Kaldi, GlobalPhone, HMM, GMM, MFCC, Speech recognition, Bulgarian, Croatian, Swedish, Kaldi, GlobalPhone, HMM, GMM, MFCC

Citation

SCHMITT, J. Rozpoznávání řeči pro vybrané jazyky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.

Language of document

cs

Study field

Informační technologie

Comittee

doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen) Dr. Ing. Petr Peringer (člen)

Date of acceptance

2013-06-10

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Na konci popisu token passing algoritmu máte menší nepřesnost, můžete ji najít a vysvětlit. Pro urychlení dekodování se používají různé optimalizace, v této práci zmiňujete užití jazykového modelu pro zmenšení dekodovacího grafu. Ktere další optimalizace založené na akustice znáte?

Result of defence

práce byla úspěšně obhájena

Document licence

Standardní licenční smlouva - přístup k plnému textu bez omezení

URI

http://hdl.handle.net/11012/52866

Collections

2013

Citace PRO

Full item page