Získávání frekventovaných vzorů z proudu dat

Dvořák, Michal

Získávání frekventovaných vzorů z proudu dat

but.committee	prof. Ing. Tomáš Hruška, CSc. (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Prof. RNDr. Milan Mišovič, CSc. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně. Otázky u obhajoby: Diskutujte vliv počtu procesorových jader na vámi implementované paralelní verze algoritmů Lossy-Counting a FP-Stream. Jaké zrychlení byste přibližně očekával na 24-jádrovém procesoru pro vaše nejlepší případy na čtyřjádrovém procesoru, tj. zrychlení 36% pro Lossy-Counting a 68% u FP-Stream?	cs
but.jazyk	čeština (Czech)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Zendulka, Jaroslav	cs
dc.contributor.author	Dvořák, Michal	cs
dc.contributor.referee	Hlosta, Martin	cs
dc.date.accessioned	2020-06-23T09:08:13Z
dc.date.available	2015-06-19	cs
dc.date.created	2012	cs
dc.description.abstract	Dolování frekventovaných vzorů z databází je již dobře prozkoumanou oblastí. Jak se však ukázalo, tyto algoritmy nejsou příliš vhodné pro zpracování proudu dat. Při dolování frekventovaných množin v proudu dat se musí udržovat kromě jednotlivých množin i jejich historie - a to nejen těch frekventovaných, ale i potenciálně frekventovaných, neboť nefrekventovaná množina se může stát časem frekventovanou. To zvyšuje nároky jak na paměť, tak na výpočetní výkon. Tato práce popisuje dva algoritmy: Lossy Counting a FP-stream. Součástí je také efektivní implementace těchto algoritmů v jazyce C# a jejich porovnání na základě měření.	cs
dc.description.abstract	Frequent-pattern mining from databases has been widely studied and frequently observed. Unfortunately, these algorithms are not suitable for data stream processing. In frequent-pattern mining from data streams, it is important to manage sets of items and also their history. There are several reasons for this; it is not just the history of frequent items, but also the history of potentially frequent sets that can become frequent later. This requires more memory and computational power. This thesis describes two algorithms: Lossy Counting and FP-stream. An effective implementation of these algorithms in C# is an integral part of this thesis. In addition, the two algorithms have been compared.	en
dc.description.mark	A	cs
dc.identifier.citation	DVOŘÁK, M. Získávání frekventovaných vzorů z proudu dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.	cs
dc.identifier.other	78644	cs
dc.identifier.uri	http://hdl.handle.net/11012/53629
dc.language.iso	cs	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Přístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 3 roku/let	cs
dc.subject	Získávání znalostí z proudu dat	cs
dc.subject	získávání frekventovaných vzorů z proudu dat	cs
dc.subject	frekventované množiny	cs
dc.subject	podpora	cs
dc.subject	Lossy Counting	cs
dc.subject	FP-growth	cs
dc.subject	FP-strom	cs
dc.subject	FP-stream	cs
dc.subject	tilted-time window.	cs
dc.subject	Knowledge discovery in a data stream	en
dc.subject	frequent pattern discovery in data streams	en
dc.subject	frequent patterns	en
dc.subject	support	en
dc.subject	Lossy Counting	en
dc.subject	FP-growth	en
dc.subject	FP-tree	en
dc.subject	FP-stream	en
dc.subject	tilted-time window.	en
dc.title	Získávání frekventovaných vzorů z proudu dat	cs
dc.title.alternative	Frequent Pattern Discovery in a Data Stream	en
dc.type	Text	cs
dc.type.driver	masterThesis	en
dc.type.evskp	diplomová práce	cs
dcterms.dateAccepted	2012-06-19	cs
dcterms.modified	2020-05-09-23:42:42	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	78644	en
sync.item.dbtype	ZP	en
sync.item.insts	2021.11.22 23:09:07	en
sync.item.modts	2021.11.22 22:39:37	en
thesis.discipline	Informační systémy	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů	cs
thesis.level	Inženýrský	cs
thesis.name	Ing.	cs

Files

Original bundle

Now showing 1 - 1 of 1

Name:: review_78644.html
Size:: 1.45 KB
Format:: Hypertext Markup Language
Description:: review_78644.html

Download

Collections

2012