Show simple item record

Frequent Pattern Discovery in a Data Stream

dc.contributor.advisorZendulka, Jaroslavcs
dc.contributor.authorDvořák, Michalcs
dc.date.accessioned2020-06-23T09:08:13Z
dc.date.available2015-06-19cs
dc.date.available2020-06-23T09:08:13Z
dc.date.created2012cs
dc.identifier.citationDVOŘÁK, M. Získávání frekventovaných vzorů z proudu dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.cs
dc.identifier.other78644cs
dc.identifier.urihttp://hdl.handle.net/11012/53629
dc.description.abstractDolování frekventovaných vzorů z databází je již dobře prozkoumanou oblastí. Jak se však ukázalo, tyto algoritmy nejsou příliš vhodné pro zpracování proudu dat. Při dolování frekventovaných množin v proudu dat se musí udržovat kromě jednotlivých množin i jejich historie - a to nejen těch frekventovaných, ale i potenciálně frekventovaných, neboť nefrekventovaná množina se může stát časem frekventovanou. To zvyšuje nároky jak na paměť, tak na výpočetní výkon. Tato práce popisuje dva algoritmy: Lossy Counting a FP-stream. Součástí je také efektivní implementace těchto algoritmů v jazyce C# a jejich porovnání na základě měření.cs
dc.description.abstractFrequent-pattern mining from databases has been widely studied and frequently observed. Unfortunately, these algorithms are not suitable for data stream processing. In frequent-pattern mining from data streams, it is important to manage sets of items and also their history. There are several reasons for this; it is not just the history of frequent items, but also the history of potentially frequent sets that can become frequent later. This requires more memory and computational power. This thesis describes two algorithms: Lossy Counting and FP-stream. An effective implementation of these algorithms in C# is an integral part of this thesis. In addition, the two algorithms have been compared. en
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsPřístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 3 roku/letcs
dc.subjectZískávání znalostí z proudu datcs
dc.subjectzískávání frekventovaných vzorů z proudu datcs
dc.subjectfrekventované množinycs
dc.subjectpodporacs
dc.subjectLossy Countingcs
dc.subjectFP-growthcs
dc.subjectFP-stromcs
dc.subjectFP-streamcs
dc.subjecttilted-time window.cs
dc.subjectKnowledge discovery in a data streamen
dc.subjectfrequent pattern discovery in data streamsen
dc.subjectfrequent patternsen
dc.subjectsupporten
dc.subjectLossy Countingen
dc.subjectFP-growthen
dc.subjectFP-treeen
dc.subjectFP-streamen
dc.subjecttilted-time window.en
dc.titleZískávání frekventovaných vzorů z proudu datcs
dc.title.alternativeFrequent Pattern Discovery in a Data Streamen
dc.typeTextcs
dcterms.dateAccepted2012-06-19cs
dcterms.modified2020-05-09-23:42:42cs
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
sync.item.dbid78644en
sync.item.dbtypeZPen
sync.item.insts2020.06.23 11:08:13en
sync.item.modts2020.06.23 10:17:26en
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
dc.contributor.refereeHlosta, Martincs
dc.description.markAcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
but.committeeprof. Ing. Tomáš Hruška, CSc. (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Prof. RNDr. Milan Mišovič, CSc. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně. Otázky u obhajoby: Diskutujte vliv počtu procesorových jader na vámi implementované paralelní verze algoritmů Lossy-Counting a FP-Stream. Jaké zrychlení byste přibližně očekával na 24-jádrovém procesoru pro vaše nejlepší případy na čtyřjádrovém procesoru, tj. zrychlení 36% pro Lossy-Counting a 68% u FP-Stream?cs
but.resultpráce byla úspěšně obhájenacs
but.programInformační technologiecs
but.jazykčeština (Czech)


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record