• čeština
    • English
  • English 
    • čeština
    • English
  • Login
View Item 
  •   Repository Home
  • Závěrečné práce
  • diplomové práce
  • Fakulta podnikatelská
  • 2015
  • View Item
  •   Repository Home
  • Závěrečné práce
  • diplomové práce
  • Fakulta podnikatelská
  • 2015
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Zlepšení předpovědi sociálních značek využitím Data Mining

Improved Prediction of Social Tags Using Data Mining

Thumbnail
View/Open
final-thesis.pdf (1.576Mb)
review_76739.html (6.457Kb)
Author
Harár, Pavol
Advisor
Kříž, Jiří
Referee
Galáž, Zoltán
Grade
C
Alternative metrics PlumX
http://hdl.handle.net/11012/39521
Altmetrics
http://hdl.handle.net/11012/39521
http://hdl.handle.net/11012/39521
Metadata
Show full item record
Abstract
Diplomová práca sa zaoberá využitím Text miningu ako metódy na predikovanie značiek článkov. Práca popisuje iteratívny spôsob narábania s veľkými súbormi dát, ich rozbor, čistenie a výpočet skóre TF-IDF pre výrazy vyskytujúce sa v článku. Detailne popisuje priebeh programu naprogramovaného v jazyku Python 3.4.3. Výsledkom spracovania viac ako 1 milióna článkov databázy webovej encyklopédie Wikipédia je slovník výrazov anglického jazyka, pomocou ktorej je možné určiť n najdôležitejších výrazov vlastných článku z korpusu článkov. Relevantnosť výsledných značiek dokazuje vhodnosť použitej metódy.
 
This master’s thesis deals with using Text mining as a method to predict tags of articles. It describes the iterative way of handling big data files, parsing the data, cleaning the data and scoring of terms in article using TF-IDF. It describes in detail the flow of program written in programming language Python 3.4.3. The result of processing more than 1 million articles from Wikipedia database is a dictionary of English terms. By using this dictionary one is capable of determining the most important terms from article in corpus of articles. Relevancy of consequent tags proves the method used in this case.
 
Keywords
Text mining, Data mining, TF-IDF, iteratívny rozbor, skóring, značky, Python, Text mining, Data mining, TF-IDF, iterative parsing, scoring, tags, Python
Language
slovenština (Slovak)
Study brunch
Informační management
Composition of Committee
prof. Ing. Oldřich Rejnuš, CSc. (předseda) doc. RNDr. Bedřich Půža, CSc. (místopředseda) Ing. Lenka Smolíková, Ph.D. (člen) Ing. Jiří Kříž, Ph.D. (člen) Ing. Karel Doubravský, Ph.D. (člen)
Date of defence
2015-06-12
Process of defence
Otázky vedoucího práce - odpovězeno. Otázky oponenta práce - odpovězeno. Ing. Doubravský Lze návrhy použít i u dalších typů souborů? Odpovězeno doc. Půža Byly návrhy aplikovány i v jiných oblastech např. na klíčová slova? Odpovězeno Ing. Smolíková Jaké jsou klíčové faktory ovlivňující datamining? Odpovězeno
Result of the defence
práce byla úspěšně obhájena
Persistent identifier
http://hdl.handle.net/11012/39521
Source
HARÁR, P. Zlepšení předpovědi sociálních značek využitím Data Mining [online]. Brno: Vysoké učení technické v Brně. Fakulta podnikatelská. 2015.
Collections
  • 2015 [406]
Citace PRO

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV
 

 

Browse

All of repositoryCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Statistics

View Usage Statistics

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV