Paralelní trénování neuronových sítí pro rozpoznávání řeči

Veselý, Karel

Paralelní trénování neuronových sítí pro rozpoznávání řeči

Mark

A

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

Abstract

Tato diplomová práce je zaměřena na paralelizaci trénování neuronových sítí pro rozpoznávání řeči. V rámci této diplomové práce byly implementovány a porovnány dvě strategie paralelizace. První strategií je paralelizace dat s využitím rozdělení trénování do několika POSIX vláken. Druhou strategií je paralelizace uzlů s využitím platformy pro obecné výpočty na grafických kartách CUDA. V případě první strategie bylo dosaženo 4x urychlení, v případě využití platformy CUDA bylo dosaženo téměř 10x urychlení. Pro trénování byl použit algoritmus Stochastic Gradient Descent se zpětným šířením chyb. Po krátkém úvodu následuje druhá kapitola práce, která je motivační a zasazuje probém do kontextu rozpoznávání řeči. Třetí kapitola práce je teoretická a diskutuje neuronové sítě a metodu trénování. Následující kapitoly jsou zaměřené na návrh a implementaci a popisují iterativní vývoj tohoto projektu. Poslední obsáhlá kapitola popisuje testovací systém a uvádí výsledky provedených experimentů. V závěru jsou krátce zhodnoceny dosažené výsledky a nastíněna perspektiva dalšího vývoje projektu.
This thesis deals with different parallelizations of training procedure for artificial neural networks. The networks are trained as phoneme-state acoustic descriptors for speech recognition. Two effective parallelization strategies were implemented and compared. The first strategy is data parallelization, where the training is split into several POSIX threads. The second strategy is node parallelization, which uses CUDA framework for general purpose computing on modern graphic cards. The first strategy showed a 4x speed-up, while using the second strategy we observed nearly 10x speed-up. The Stochastic Gradient Descent algorithm with error backpropagation was used for the training. After a short introduction, the second chapter of this thesis shows the motivation and introduces the neural networks into the context of speech recognition. The third chapter is theoretical, the anatomy of a neural network and the used training method are discussed. The following chapters are focused on the design and implementation of the project, while the phases of the iterative development are described. The last extensive chapter describes the setup of the testing system and reports the experimental results. Finally, the obtained results are concluded and the possible extensions of the project are proposed.

Keywords

neuronová síť, akustický model, rozpoznávání řeči, rychlé trénování, paralelizace dat, POSIX vlákna, paralelizace uzlů, CUDA, GPGPU, neural network, acoustic model, speech recognition, fast training, data parallelization, POSIX threads, node parallelization, CUDA, GPGPU

Citation

VESELÝ, K. Paralelní trénování neuronových sítí pro rozpoznávání řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.

Language of document

cs

Study field

Počítačová grafika a multimédia

Comittee

prof. Dr. Ing. Pavel Zemčík (předseda) prof. RNDr. Milan Češka, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen) doc. Ing. Stanislav Racek, CSc. (člen) doc. RNDr. Pavel Smrž, Ph.D. (člen)

Date of acceptance

2010-06-24

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: V CUDA implementaci jste přesunuli část parametrizace z CPU na GPU s tím, že dvě CPU vlákna představují úzké hrdlo výpočtu. Kdybychom použili výkonnější CPU s více jádry, mělo by smysl vrátit parametrizaci zpět na CPU? Představuje konkrétní typ grafické karty specifické omezení na topologii trénované sítě? Je možné vyhodnotit využití potenciálu GPU v závislosti na úloze? Pokud bychom měli k dispozici mnohojádrový počítač s jedinou výkonnou grafickou kartou, bylo by možné tuto kartu sdílet více paralelními tréninky bez ztráty výkonnosti?

Result of defence

práce byla úspěšně obhájena

Document licence

Standardní licenční smlouva - přístup k plnému textu bez omezení

URI

http://hdl.handle.net/11012/54327

Collections

2010

Citace PRO

Full item page