Finite State Grammars and Language Models for Automatic Speech Recognition
Finite State Grammars and Language Models for Automatic Speech Recognition
Author
Advisor
Hannemann, MirkoReferee
Glembek, OndřejGrade
AAltmetrics
Metadata
Show full item recordAbstract
Tato práce se zabývá transformací bezkontextových gramatik na váhované konečně stavové převodníky. Je vybrána podmnožina bezkontextových gramatik, kterou lze tranformovat přesně. Je představen test, zda daná gramatika naleží do této podmnožiny, i algoritmus převodu. Dále je popsán vlastní nástroj, který tyto postupy implementuje, včetně způsobu zpracování vstupu a výstupu. S použitím toho nástroje byl vytvořen systém rozpoznání řeči pro kokpit letadla. Jsou představeny výsledky ukazující, že systém založený na takto získaném modelu jazyka podává výrazně lepší výkon, než je dosažen při použití obecného modelu. This thesis deals with the transformation of Context Free Grammars (CFG) into Weighted Finite State Transducers (WFST). A subset of CFG is chosen, that can be transformed exactly. Both the test of whether a CFG fulfills such condition and the algorithm for the following transformation are presented. A tool has been implemented, which performs both these tasks, also its input and output processing are reported. Using this tool, a speech recognition system for aircraft cockpit control has been built. Results are presented which show, that the system based on the transformed grammar outperforms the system based on general-purpose language model.
Keywords
jazykový model, bezkontextová gramatika, váhované konečně stavové převodníky, rozpoznávací síť, automatické rozpoznávání řeči, Language Model, Context Free Grammar, Weighted Finite State Transducer, recognition network, automatic speech recognitionLanguage
angličtina (English)Study brunch
Informační technologieComposition of Committee
doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. František Zbořil, CSc. (místopředseda) Ing. Vítězslav Beran, Ph.D. (člen) Ing. Michal Bidlo, Ph.D. (člen) Ing. Karel Masařík, Ph.D. (člen)Date of defence
2014-06-18Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: * Jaké typy polookruhů (semiring) se převážně v rozpoznávání řeči používají?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/56551Source
BENEŠ, K. Finite State Grammars and Language Models for Automatic Speech Recognition [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2014.Collections
- 2014 [305]