Statistické jazykové modely založené na neuronových sítích

but.committeecs
but.defencecs
but.jazykangličtina (English)
but.programVýpočetní technika a informatikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorČernocký, Janen
dc.contributor.authorMikolov, Tomášen
dc.contributor.refereeZweig, Geoffreyen
dc.contributor.refereeHajič,, Janen
dc.date.accessioned2018-05-17T19:38:27Z
dc.date.available2018-05-17T19:38:27Z
dc.date.createdcs
dc.description.abstractStatistické jazykové modely jsou důležitou součástí mnoha úspěšných aplikací, mezi něž patří například automatické rozpoznávání řeči a strojový překlad (příkladem je známá aplikace Google Translate). Tradiční techniky pro odhad těchto modelů jsou založeny na tzv. N-gramech. Navzdory známým nedostatkům těchto technik a obrovskému úsilí výzkumných skupin napříč mnoha oblastmi (rozpoznávání řeči, automatický překlad, neuroscience, umělá inteligence, zpracování přirozeného jazyka, komprese dat, psychologie atd.), N-gramy v podstatě zůstaly nejúspěšnější technikou. Cílem této práce je prezentace několika architektur jazykových modelůzaložených na neuronových sítích. Ačkoliv jsou tyto modely výpočetně náročnější než N-gramové modely, s technikami vyvinutými v této práci je možné jejich efektivní použití v reálných aplikacích. Dosažené snížení počtu chyb při rozpoznávání řeči oproti nejlepším N-gramovým modelům dosahuje 20%. Model založený na rekurentní neurovové síti dosahuje nejlepších publikovaných výsledků na velmi známé datové sadě (Penn Treebank).en
dc.description.abstractStatistical language models are crucial part of many successful applications, such as automatic speech recognition and statistical machine translation (for example well-known Google Translate). Traditional techniques for estimating these models are based on Ngram counts. Despite known weaknesses of N-grams and huge efforts of research communities across many fields (speech recognition, machine translation, neuroscience, artificial intelligence, natural language processing, data compression, psychology etc.), N-grams remained basically the state-of-the-art. The goal of this thesis is to present various architectures of language models that are based on artificial neural networks. Although these models are computationally more expensive than N-gram models, with the presented techniques it is possible to apply them to state-of-the-art systems efficiently. Achieved reductions of word error rate of speech recognition systems are up to 20%, against stateof-the-art N-gram model. The presented recurrent neural network based model achieves the best published performance on well-known Penn Treebank setup.cs
dc.description.markPcs
dc.identifier.citationMIKOLOV, T. Statistické jazykové modely založené na neuronových sítích [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .cs
dc.identifier.other99806cs
dc.identifier.urihttp://hdl.handle.net/11012/63271
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectjazykový modelen
dc.subjectneuronová sít’en
dc.subjectrekurentníen
dc.subjectmaximální entropieen
dc.subjectrozpoznávání řečien
dc.subjectkomprese daten
dc.subjectumělá inteligenceen
dc.subjectlanguage modelcs
dc.subjectneural networkcs
dc.subjectrecurrentcs
dc.subjectmaximum entropycs
dc.subjectspeech recognitioncs
dc.subjectdata compressioncs
dc.subjectartificial intelligencecs
dc.titleStatistické jazykové modely založené na neuronových sítíchen
dc.title.alternativeSTATISTICAL LANGUAGE MODELS BASED ON NEURAL NETWORKScs
dc.typeTextcs
dc.type.driverdoctoralThesisen
dc.type.evskpdizertační prácecs
dcterms.dateAccepted2012-10-02cs
dcterms.modified2020-05-10-17:46:41cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid99806en
sync.item.dbtypeZPen
sync.item.insts2021.11.22 23:18:34en
sync.item.modts2021.11.22 22:53:24en
thesis.disciplineVýpočetní technika a informatikacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelDoktorskýcs
thesis.namePh.D.cs
Files
Original bundle
Now showing 1 - 5 of 6
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
794.3 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
thesis-1.pdf
Size:
286.63 KB
Format:
Adobe Portable Document Format
Description:
thesis-1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-283_s1.pdf
Size:
57.46 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-283_s1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-283_o1.pdf
Size:
943.4 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-283_o1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-283_o2.pdf
Size:
845.88 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-283_o2.pdf
Collections