Získávání frekventovaných vzorů z proudu dat

but.committeeprof. Ing. Tomáš Hruška, CSc. (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Prof. RNDr. Milan Mišovič, CSc. (člen) doc. Ing. Jaroslav Zendulka, CSc. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně. Otázky u obhajoby: Diskutujte vliv počtu procesorových jader na vámi implementované paralelní verze algoritmů Lossy-Counting a FP-Stream. Jaké zrychlení byste přibližně očekával na 24-jádrovém procesoru pro vaše nejlepší případy na čtyřjádrovém procesoru, tj. zrychlení 36% pro Lossy-Counting a 68% u FP-Stream?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorZendulka, Jaroslavcs
dc.contributor.authorDvořák, Michalcs
dc.contributor.refereeHlosta, Martincs
dc.date.accessioned2020-06-23T09:08:13Z
dc.date.available2015-06-19cs
dc.date.created2012cs
dc.description.abstractDolování frekventovaných vzorů z databází je již dobře prozkoumanou oblastí. Jak se však ukázalo, tyto algoritmy nejsou příliš vhodné pro zpracování proudu dat. Při dolování frekventovaných množin v proudu dat se musí udržovat kromě jednotlivých množin i jejich historie - a to nejen těch frekventovaných, ale i potenciálně frekventovaných, neboť nefrekventovaná množina se může stát časem frekventovanou. To zvyšuje nároky jak na paměť, tak na výpočetní výkon. Tato práce popisuje dva algoritmy: Lossy Counting a FP-stream. Součástí je také efektivní implementace těchto algoritmů v jazyce C# a jejich porovnání na základě měření.cs
dc.description.abstractFrequent-pattern mining from databases has been widely studied and frequently observed. Unfortunately, these algorithms are not suitable for data stream processing. In frequent-pattern mining from data streams, it is important to manage sets of items and also their history. There are several reasons for this; it is not just the history of frequent items, but also the history of potentially frequent sets that can become frequent later. This requires more memory and computational power. This thesis describes two algorithms: Lossy Counting and FP-stream. An effective implementation of these algorithms in C# is an integral part of this thesis. In addition, the two algorithms have been compared. en
dc.description.markAcs
dc.identifier.citationDVOŘÁK, M. Získávání frekventovaných vzorů z proudu dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.cs
dc.identifier.other78644cs
dc.identifier.urihttp://hdl.handle.net/11012/53629
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsPřístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 3 roku/letcs
dc.subjectZískávání znalostí z proudu datcs
dc.subjectzískávání frekventovaných vzorů z proudu datcs
dc.subjectfrekventované množinycs
dc.subjectpodporacs
dc.subjectLossy Countingcs
dc.subjectFP-growthcs
dc.subjectFP-stromcs
dc.subjectFP-streamcs
dc.subjecttilted-time window.cs
dc.subjectKnowledge discovery in a data streamen
dc.subjectfrequent pattern discovery in data streamsen
dc.subjectfrequent patternsen
dc.subjectsupporten
dc.subjectLossy Countingen
dc.subjectFP-growthen
dc.subjectFP-treeen
dc.subjectFP-streamen
dc.subjecttilted-time window.en
dc.titleZískávání frekventovaných vzorů z proudu datcs
dc.title.alternativeFrequent Pattern Discovery in a Data Streamen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2012-06-19cs
dcterms.modified2020-05-09-23:42:42cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid78644en
sync.item.dbtypeZPen
sync.item.insts2021.11.22 23:09:07en
sync.item.modts2021.11.22 22:39:37en
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
review_78644.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
review_78644.html
Collections