Získávání frekventovaných vzorů z proudu dat
but.committee | prof. Ing. Tomáš Hruška, CSc. (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Prof. RNDr. Milan Mišovič, CSc. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně. Otázky u obhajoby: Diskutujte vliv počtu procesorových jader na vámi implementované paralelní verze algoritmů Lossy-Counting a FP-Stream. Jaké zrychlení byste přibližně očekával na 24-jádrovém procesoru pro vaše nejlepší případy na čtyřjádrovém procesoru, tj. zrychlení 36% pro Lossy-Counting a 68% u FP-Stream? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Zendulka, Jaroslav | cs |
dc.contributor.author | Dvořák, Michal | cs |
dc.contributor.referee | Hlosta, Martin | cs |
dc.date.accessioned | 2020-06-23T09:08:13Z | |
dc.date.available | 2015-06-19 | cs |
dc.date.created | 2012 | cs |
dc.description.abstract | Dolování frekventovaných vzorů z databází je již dobře prozkoumanou oblastí. Jak se však ukázalo, tyto algoritmy nejsou příliš vhodné pro zpracování proudu dat. Při dolování frekventovaných množin v proudu dat se musí udržovat kromě jednotlivých množin i jejich historie - a to nejen těch frekventovaných, ale i potenciálně frekventovaných, neboť nefrekventovaná množina se může stát časem frekventovanou. To zvyšuje nároky jak na paměť, tak na výpočetní výkon. Tato práce popisuje dva algoritmy: Lossy Counting a FP-stream. Součástí je také efektivní implementace těchto algoritmů v jazyce C# a jejich porovnání na základě měření. | cs |
dc.description.abstract | Frequent-pattern mining from databases has been widely studied and frequently observed. Unfortunately, these algorithms are not suitable for data stream processing. In frequent-pattern mining from data streams, it is important to manage sets of items and also their history. There are several reasons for this; it is not just the history of frequent items, but also the history of potentially frequent sets that can become frequent later. This requires more memory and computational power. This thesis describes two algorithms: Lossy Counting and FP-stream. An effective implementation of these algorithms in C# is an integral part of this thesis. In addition, the two algorithms have been compared. | en |
dc.description.mark | A | cs |
dc.identifier.citation | DVOŘÁK, M. Získávání frekventovaných vzorů z proudu dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012. | cs |
dc.identifier.other | 78644 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/53629 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Přístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 3 roku/let | cs |
dc.subject | Získávání znalostí z proudu dat | cs |
dc.subject | získávání frekventovaných vzorů z proudu dat | cs |
dc.subject | frekventované množiny | cs |
dc.subject | podpora | cs |
dc.subject | Lossy Counting | cs |
dc.subject | FP-growth | cs |
dc.subject | FP-strom | cs |
dc.subject | FP-stream | cs |
dc.subject | tilted-time window. | cs |
dc.subject | Knowledge discovery in a data stream | en |
dc.subject | frequent pattern discovery in data streams | en |
dc.subject | frequent patterns | en |
dc.subject | support | en |
dc.subject | Lossy Counting | en |
dc.subject | FP-growth | en |
dc.subject | FP-tree | en |
dc.subject | FP-stream | en |
dc.subject | tilted-time window. | en |
dc.title | Získávání frekventovaných vzorů z proudu dat | cs |
dc.title.alternative | Frequent Pattern Discovery in a Data Stream | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2012-06-19 | cs |
dcterms.modified | 2020-05-09-23:42:42 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 78644 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2021.11.22 23:09:07 | en |
sync.item.modts | 2021.11.22 22:39:37 | en |
thesis.discipline | Informační systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- review_78644.html
- Size:
- 1.45 KB
- Format:
- Hypertext Markup Language
- Description:
- review_78644.html