Metody shlukování textových dat
Textual Data Clustering Methods
dc.contributor.advisor | Bartík, Vladimír | cs |
dc.contributor.author | Miloš, Roman | cs |
dc.date.accessioned | 2018-10-29T13:02:39Z | |
dc.date.available | 2018-10-29T13:02:39Z | |
dc.date.created | 2011 | cs |
dc.identifier.citation | MILOŠ, R. Metody shlukování textových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011. | cs |
dc.identifier.other | 42358 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/54203 | |
dc.description.abstract | Shlukování textových dat je jednou z úloh dolování v textech. Slouží k rozdělení dokumentů do různých kategorií na základě jejich podobnosti, což nám umožňuje snadnější vyhledávání v takto rozdělených dokumentech. V práci jsou popsány současné metody sloužící k shlukování textových dokumentů, jež se využívají. Z těchto metod je vybrán algoritmus Simultaneous keyword identification and clustering of text documents (SKWIC), který by měl při shlukování dosahovat lepších výsledků, než standardní algoritmy jako např. k-means. Je navrhnuta a implementována aplikace řešící tento algoritmus. Na závěr je provedeno srovnání SKWIC se standardním k-means. | cs |
dc.description.abstract | Clustering of text data is one of tasks of text mining. It divides documents into the different categories that are based on their similarities. These categories help to easily search in the documents. This thesis describes the current methods that are used for the text document clustering. From these methods we chose Simultaneous keyword identification and clustering of text documents (SKWIC). It should achieve better results than the standard clustering algorithms such as k-means. There is designed and implemented an application for this algorithm. In the end, we compare SKWIC with a k-means algorithm. | en |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Dolování v textu | cs |
dc.subject | shlukování textů | cs |
dc.subject | SKWIC | cs |
dc.subject | VSM model | cs |
dc.subject | Java | cs |
dc.subject | předzpracováni | cs |
dc.subject | Rapid Miner | cs |
dc.subject | Text mining | en |
dc.subject | text clustering | en |
dc.subject | SKWIC | en |
dc.subject | VSM model | en |
dc.subject | Java | en |
dc.subject | preprocessing | en |
dc.subject | Rapid Miner | en |
dc.title | Metody shlukování textových dat | cs |
dc.title.alternative | Textual Data Clustering Methods | en |
dc.type | Text | cs |
dcterms.dateAccepted | 2011-06-20 | cs |
dcterms.modified | 2014-07-17-13:53:38 | cs |
thesis.discipline | Informační systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
sync.item.dbid | 42358 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2018.11.02 04:40:24 | en |
sync.item.modts | 2018.10.22 15:53:26 | en |
dc.contributor.referee | Burgetová, Ivana | cs |
dc.description.mark | C | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
2011 [191]