Show simple item record

Analysis of Product Reviews

dc.contributor.advisorSmrž, Pavelsk
dc.contributor.authorKlocok, Andrejsk
dc.date.accessioned2020-07-20T19:57:54Z
dc.date.available2020-07-20T19:57:54Z
dc.date.created2020cs
dc.identifier.citationKLOCOK, A. Analýza recenzí výrobků [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.cs
dc.identifier.other129278cs
dc.identifier.urihttp://hdl.handle.net/11012/192460
dc.description.abstractZákazníci internetových obchodov generujú obrovské množstvo informácii o službách a produktoch pomocou recenzií, ktoré sú dôležitým zdrojom spätnej väzby. Táto diplomová práca sa zaoberá vytvorením systému pre analýzu recenzií výrobkov a obchodov v českom jazyku. Popisuje doterajšie spôsoby analýzy sentimentu a naväzuje na aktuálne riešenia. Výsledný systém implementuje automatické sťahovanie dát a ich indexáciu, následne analýzu sentimentu spolu so sumarizáciou textu v podobe zhlukovania podobných viet na základe vektorovej reprezentácie textu. Súčasťou je aj grafické užívateľské rozhranie vo forme webovej stránky. Počas semestra bol vytvorený dataset recenzií s celkovým počtom prevyšujúci šesť miliónov recenzií spolu s rozhraním na jednoduchý export dát.sk
dc.description.abstractOnline store customers generate vast amounts of product and service information through reviews, which are an important source of feedback. This thesis deals with the creation of a system for the analysis of product and shop reviews in the czech language. It describes the current methods of sentiment analysis and builds on current solutions. The resulting system implements automatic data download and their indexing, subsequently sentiment analysis together with text summary in the form of clustering of similar sentences based on vector representation of the text. A graphical user interface in the form of a web page is also included. A review data set with a total of more than six million reviews was created during the semester along with an interface for easy data export.en
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectspracovanie prirodzeného jazykask
dc.subjectrecenziask
dc.subjectanalýza sentimentusk
dc.subjectklasifikáciask
dc.subjectextrakcia dát z webusk
dc.subjectstrojové učeniesk
dc.subjectreprezentácia textusk
dc.subjectnatural language processingen
dc.subjectreviewen
dc.subjectsentiment analysisen
dc.subjectclasificationen
dc.subjectweb scrappingen
dc.subjectmachine learningen
dc.subjecttext representationen
dc.titleAnalýza recenzí výrobkůsk
dc.title.alternativeAnalysis of Product Reviewsen
dc.typeTextcs
dcterms.dateAccepted2020-07-17cs
dcterms.modified2020-07-17-14:44:57cs
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
sync.item.dbid129278en
sync.item.dbtypeZPen
sync.item.insts2020.07.20 21:57:54en
sync.item.modts2020.07.18 08:18:52en
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
dc.contributor.refereeDoležal, Jansk
dc.description.markCcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
but.committeedoc. Mgr. Adam Rogalewicz, Ph.D. (předseda) doc. Ing. Peter Chudý, Ph.D., MBA (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Dr. Ing. Petr Peringer (člen) RNDr. Marek Rychlý, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: V technické zprávě píšete (pod napisem "Predspracovanie dát" na str. 27-28): """ Síce aktuálne riešenia mapovania sekvencií do vektorového priestoru využívajú vlastné tokenizery, ako napríklad kúsky slov, je vhodné tieto dáta tokenizovať, lemantizovať, poprípade previesť do kmeňového tvaru (stem), odstrániť stop slová, pre ďalšie spracovanie. """, ale už nepíšete, proč je vhodné data tokenizovat vlastním způsobem. Mohl byste toto objasnit? Na str. 29 zmiňujete pojmy "pretrénovanie" a "pred-trénovanie" v tom samém významu, což považuji za chybu (tato chyba se vyskytuje vícekrát, domnívám se tedy, že se nejedná o překlep). Mohl byste vysvětlit pojmy "přetrénování" (over-training) a "předtrénování" (pre-training) v kontextu neuronových sítí? Jak dlouho vám trvalo vytvořit dataset? Zkoušel jste web Heureka.cz kontaktovat?cs
but.resultpráce byla úspěšně obhájenacs
but.programInformační technologiecs
but.jazykslovenština (Slovak)


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record