Optimalizace spouštěcích konfigurací k-Wave úloh

Sasák, Tomáš

Optimalizace spouštěcích konfigurací k-Wave úloh

Mark

A

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

Abstract

Táto práca sa zaoberá plánovaním, resp. správnym odhadom spúšťacích konfigurácií úloh k-Wave na superpočítačoch infraštruktúry IT4Innovations. Presnejšie pre klastre Salomon a Anselm. Úloha predstavuje množinu simulácií, kde každá simulácia je spúšťaná pod toolboxom k-Wave. Pre spustenie jednotlivých simulácií je nutné správne vytvoriť konfiguráciu, ktorá sa skladá z množstva zdrojov (počet výpočtových uzlov, resp. jadier) a času rezervácie superpočítača, čo je pre neskúseného zložité odhadnúť. Zvolený problém odhadu je riešený na základe empirických dát, ktoré boli získané viacnásobným spúšťaním rôznych množín simulácií na klastroch. Tieto dáta sú uložené a spracované aproximátormi, ktoré konkrétne vykonávajú odhad týchto parametrov na základe metód interpolácie a regresie. V práci je popísaný a bol implementovaný systém predstavujúci plánovač, ktorý predstavuje rozhranie pre odhad. Experimentovaním bolo zistené že pre tento špecifický problém najpresnejšie odhady vykonáva trojica Akima spline, PCHIP interpolácia a kubický spline. Výsledky tejto práce umožňujú vykonávať istý odhad exekučného času a počtu vlákien pre ľubovolné simulácie automaticky a bez znalosti kódu k-Wave.
This thesis focuses on scheduling, i.e. correct approximation of configurations used to run k-Wave simulations on supercomputers from the IT4Innovations infrastructure. Especially, for clusters Salomon and Anselm. A single work is composed of a set which contains many simulations. Every simulation is executed by some code from the k-Wave toolbox. To calculate the simulation, it is necesarry to select a suitable configuration, which means the amount of supercomputer resources (number of nodes, i.e. cores), and the duration of the rental. Creation of an ideal configuration is complicated and is even harder for an inexperienced user. The approximation is made based on the empiric data, obtained from multiple executions of different sets of simulations on given clusters. This data is stored and used by a set of approximators, which performs the actual approximation by methods of interpolation and regression. The text describes the implementation of the final scheduler. By experimenting, the most efficient methods for this problem has found out to be Akima spline, PCHIP interpolation and cubic spline. The main contribution of this work is creation of a tool which can find suitable configuration for k-Wave simulation without knowing the code or having lots of experience with its usage.

Citation

SASÁK, T. Optimalizace spouštěcích konfigurací k-Wave úloh [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.

Language of document

cs

Study field

Informační technologie

Comittee

prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) Ing. Vítězslav Beran, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)

Date of acceptance

2020-07-13

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Můžete vysvětlit, proč v případech, kdy pro danou velikost úlohy existuje v databázi více měření, průměrujete výpočetní časy těchto měření? Proč nepočítáte třeba střední hodnotu? Jak se plánuje úloha, pro kterou plánovač nemůže použít žádná historická data v databázi? Mohl byste procentuálně vyjádřit, jak se liší naměřená data (výpočetní čas pro daný počet jader a velikost úlohy) od těch aproximovaných? Jak jsou od sebe body vzdáleny? Jak byste vyhodnotil, který aproximátor je v daném případě nejvhodnější, aby plánování a spuštění úlohy mohlo probíhat automatizovaně? Píšete, že by vaše aplikace mohla být v budoucnu používána nástrojem k-Dispatch. k-Dispatch je ale postaven na Pythonu 3.5. Je vaše aplikace zpětně kompatibilní, popř. jaké změny by bylo nutné implementovat? Jste u uvedeného článku spoluautorem?

Result of defence

práce byla úspěšně obhájena

Document licence

Standardní licenční smlouva - přístup k plnému textu bez omezení

URI

http://hdl.handle.net/11012/191550

Citace PRO

Full item page