Akcelerace ultrazvukových simulací pomocí multi-GPU systémů

No Thumbnail Available
Date
ORCID
Mark
E
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
V této práci je kladen důraz na multi - GPU systémy a využití CUDA unifikované paměti.Hlavním cílem je akcelerovat výpočet 3D FFT, který je hlavní součástí simulací knihovny k- Wave .K- Wave je C++/ Matlab knihovna určena pro simulaci šíření ultrazvukových vln v 1D , 2D nebo 3D prostoru.Akcelerace těchto funkcí je potřebná, jelikož se jedná o výpočetně náročně simulace.
The main focus of this project is usage of multi - GPU systems and usage of CUDA unified memory . Its goal is to accelerate computation of 2D and 3D FFT, which is the main part of simulations in k- Wave library .K- Wave is a C++/ Matlab library used for simulations of propagation of ultrasonic waves in 1D , 2D or 3D space . Acceleration of these functions is necessary , because the simulations are computationally intensive .
Description
Citation
STODŮLKA, M. Akcelerace ultrazvukových simulací pomocí multi-GPU systémů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Superpočítání
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) prof. RNDr. Milan Češka, CSc. (člen) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen)
Date of acceptance
2021-06-22
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: Ve vyhodnocení operace broadcast zmiňujete, že propustnost může být omezena komunikací mezi CPU a každým GPU samostatně. Jakým způsobem by bylo možné tento problém odstranit? Jak se tento problém obvykle řeší v systémech s mnoha uzly? V textu práce na několika místech popisujete, že daná úloha byla příliš krátká a nebylo tedy možné dosáhnout dostatečné přesnosti měření. Jakým způsobem se tento problém obvykle řeší? Jaké prostředky pro přesné měření délky vykonávání operací na GPU nabízí CUDA a proč je nebylo možné použít? Jak by bylo navržené řešení možné rozšířit, tak aby umožnilo efektivní zpracování simulačních domén vetších než paměť jednoho GPU?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO