Zobrazit minimální záznam

Textual Data Clustering Methods

dc.contributor.advisorBartík, Vladimírcs
dc.contributor.authorMiloš, Romancs
dc.date.accessioned2018-10-29T13:02:39Z
dc.date.available2018-10-29T13:02:39Z
dc.date.created2011cs
dc.identifier.citationMILOŠ, R. Metody shlukování textových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011.cs
dc.identifier.other42358cs
dc.identifier.urihttp://hdl.handle.net/11012/54203
dc.description.abstractShlukování textových dat je jednou z úloh dolování v textech. Slouží k rozdělení dokumentů do různých kategorií na základě jejich podobnosti, což nám umožňuje snadnější vyhledávání v takto rozdělených dokumentech. V práci jsou popsány současné metody sloužící k shlukování textových dokumentů, jež se využívají. Z těchto metod je vybrán algoritmus Simultaneous keyword identification and clustering of text documents (SKWIC), který by měl při shlukování dosahovat lepších výsledků, než standardní algoritmy jako např. k-means. Je navrhnuta a implementována aplikace řešící tento algoritmus. Na závěr je provedeno srovnání SKWIC se standardním k-means.cs
dc.description.abstractClustering of text data is one of tasks of text mining. It divides documents into the different categories that are based on their similarities. These categories help to easily search in the documents. This thesis describes the current methods that are used for the text document clustering. From these methods we chose Simultaneous keyword identification and clustering of text documents (SKWIC). It should achieve better results than the standard clustering algorithms such as k-means. There is designed and implemented an application for this algorithm. In the end, we compare SKWIC with a k-means algorithm.en
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectDolování v textucs
dc.subjectshlukování textůcs
dc.subject SKWICcs
dc.subjectVSM modelcs
dc.subjectJavacs
dc.subjectpředzpracovánics
dc.subjectRapid Minercs
dc.subjectText miningen
dc.subjecttext clusteringen
dc.subjectSKWICen
dc.subjectVSM modelen
dc.subjectJavaen
dc.subjectpreprocessingen
dc.subjectRapid Mineren
dc.titleMetody shlukování textových datcs
dc.title.alternativeTextual Data Clustering Methodsen
dc.typeTextcs
dcterms.dateAccepted2011-06-20cs
dcterms.modified2014-07-17-13:53:38cs
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
sync.item.dbid42358en
sync.item.dbtypeZPen
sync.item.insts2018.11.02 04:40:24en
sync.item.modts2018.10.22 15:53:26en
dc.contributor.refereeBurgetová, Ivanacs
dc.description.markCcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs


Soubory tohoto záznamu

Thumbnail
Thumbnail

Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam