Show simple item record

Machine-Learning Methods in Natural Language Processing

dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorVodička, Jancs
dc.date.accessioned2022-06-13T22:53:00Z
dc.date.available2022-06-14cs
dc.date.available2022-06-13T22:53:00Z
dc.date.created2012cs
dc.identifier.citationVODIČKA, J. Metody strojového učení ve zpracování přirozeného jazyka [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.cs
dc.identifier.other78715cs
dc.identifier.urihttp://hdl.handle.net/11012/55221
dc.identifier.urihttp://hdl.handle.net/11012/205172
dc.description.abstractBakalářská práce se zajímá hodnocením sentimentu textu v českém jazyce za pomocí metod strojového učení, hlavně za použití naivního bayesovského klasifikátoru. Členění probíhá do dvou kategorií - pozitivní, negativní zprávy.  Jako datové zdroje pro automatické vytvoření korpusu jsou použity zprávy ze sociální sítě Twitter, zbožového porovnávače Heuréka, filmové databáze ČSFD a restauračního portálu Scuk. Jsou porovnány z hlediska výkonnosti při hodnocení sentimentu. Následně je sestavena výsledná tréninková sada, která je použita při hodnocení zpráv z Twitteru v téměř reálném čase.cs
dc.description.abstractBachelor's thesis deals with sentiment analysis using machine learning methods, mainly naive bayes classifier. Input text can be classified as positive or negative message. There are used several data sources for create of automatic annotated corpus - social network Twitter, price comparator Heureka, movie database ČSFD and restaurant portal Scuk. These sources are compared in terms of performance in assessing the sentiment. Consequently, the final training dataset is created and used at almost real-time Twitter sentiment analysis.en
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsPřístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 10 roku/letcs
dc.subjectStrojové učenícs
dc.subjectnaivní bayesovský klasifikátorcs
dc.subjecthodnocení sentimentucs
dc.subjectdolování názorůcs
dc.subjectTwittercs
dc.subjectMachine learningen
dc.subjectnaive Bayes classifieren
dc.subjectsentiment analysisen
dc.subjectopinion miningen
dc.subjectTwitteren
dc.titleMetody strojového učení ve zpracování přirozeného jazykacs
dc.title.alternativeMachine-Learning Methods in Natural Language Processingen
dc.typeTextcs
dcterms.dateAccepted2012-06-14cs
dcterms.modified2020-05-09-23:42:58cs
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
sync.item.dbid78715en
sync.item.dbtypeZPen
sync.item.insts2022.06.14 00:53:00en
sync.item.modts2022.06.14 00:14:06en
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
dc.contributor.refereeOtrusina, Lubomírcs
dc.description.markCcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
but.committeedoc. Ing. František Zbořil, CSc. (předseda) prof. Ing. Martin Drahanský, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen) Ing. Josef Strnadel, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C (dobře). Otázky u obhajoby: Proč jste ve své práci kategorizoval dokumenty jen do kategorií "pozitivní", "negativní" a nepřidal jste i kategorii "neutrální"? Datové sady jste vytvářel buď ručně, kde to není problém přidat, a nebo jste je uměle vytvářel z procentních bodů, kde by také nebyl problém tuto kategorii dodělat. V kapitole 5.1.1 o použití naivního Bayesova klasifikátoru píšete, že je možné zanedbat apriorní pravděpodobnost. Můžete komisi objasnit jak jste to myslel?cs
but.resultpráce byla úspěšně obhájenacs
but.programInformační technologiecs
but.jazykčeština (Czech)


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record