Škálovatelné strojové učení s využitím nástrojů Hadoop a Mahout
Scalable machine learning using Hadoop and Mahout tools
Author
Advisor
Burget, RadimReferee
Atassi, HichamGrade
AAltmetrics
Metadata
Show full item recordAbstract
Tato bakalářská práce srovnává několik nástrojů pro realizaci škálovatelné platformy strojového učení a popisuje jejich výhody a nevýhody. Dále práce prakticky realizuje funkčnost škálovatelné platformy založené na nástroji Apache Hadoop a zabývá se měřením výkonu samoučícího algoritmu K-Means pomocí knihoven strojového učení Apache Mahout na celkem pěti výpočetních uzlech. This bachelor’s thesis compares several tools for building a scalable, machine learning platform and describes their advantages and disadvantages. It also practically demonstrates functionality of this scalable platform based on the Apache Hadoop and Apache Mahout tools and measures performance of the K-Means algorithm for total of five computing nodes.
Keywords
Hadoop, Mahout, superpočítač, paralelní zpracování dat, strojové učení, Hadoop, Mahout, supercomputer, parallel supercomputing, machine learningLanguage
čeština (Czech)Study brunch
TeleinformatikaComposition of Committee
prof. Ing. Jiří Mišurec, CSc. (předseda) doc. Ing. Petr Sysel, Ph.D. (místopředseda) Ing. Martin Sýkora (člen) doc. Ing. Radim Burget, Ph.D. (člen) prof. Ing. Jaroslav Koton, Ph.D. (člen) Ing. Radim Číž, Ph.D. (člen) Ing. Vladimír Červenka, Ph.D. (člen)Date of defence
2012-06-13Process of defence
Je nějaké omezení paměti při využití techbologie CUDA?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/10042Source
KRYŠKE, L. Škálovatelné strojové učení s využitím nástrojů Hadoop a Mahout [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012.Collections
- 2012 [467]