Metody pro získávání asociačních pravidel z dat
Methods for Mining Association Rules from Data
Author
Advisor
Bartík, VladimírReferee
Burget, RadekGrade
AAltmetrics
Metadata
Show full item recordAbstract
Cieľom práce je implementácia metódy Multipass-Apriori pre získavanie asociačných pravidiel z textových dát. Po úvode do problematiky dolovania z dát je spomenutá špecifickosť dolovania znalostí z textových dát. Veľmi dôležitú úlohu v tomto procese zohráva predspracovanie, v tomto prípade najmä použitie stemmingu, a vytvorenie slovníka nepotrebných slov (stopwords). Významu, využitiu a procesu získavania asociačných pravidiel je venovaná ďalšia časť práce. Najväčšia pozornosť je venovaná metóde Multipass-Apriori, ktorá bola naimplementovaná a bol popísaný princíp jej fungovania. Na základe vykonaných testov bol stanovený optimálny spôsob rozdelenia partícií a spôsob usporiadania množín. Pri praktických testoch bola metóda Multipass-Apriori porovnávaná s metódou Apriori. The aim of this thesis is to implement Multipass-Apriori method for mining association rules from text data. After the introduction to the field of knowledge discovery, the specific aspects of text mining are mentioned. In the mining process, preprocessing is a very important problem, use of stemming and stop words dictionary is necessary in this case. Next part of thesis deals with meaning, usage and generating of association rules. The main part is focused on the description of Multipass-Apriori method, which was implemented. On the ground of executed tests the most optimal way of dividing partitions was set and also the best way of sorting the itemsets. As a part of testing, Multipass-Apriori method was compared with Apriori method.
Keywords
frekventovaná množina, asociačné pravidlo, Apriori, Multipass-Apriori, stemming, slovník nepotrebných slov, predspracovanie textových dát, frequent itemset, association rules, Apriori, Multipass-Apriori, stemming, stop words, text data preprocessingLanguage
čeština (Czech)Study brunch
Informační systémyComposition of Committee
Date of defence
2007-06-18Process of defence
Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/53960Source
UHLÍŘ, M. Metody pro získávání asociačních pravidel z dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2007.Collections
- 2007 [95]