Show simple item record

Machine Learning in the Domain of Stylometry and Authorship Attribution

dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorDrápela, Karelcs
dc.date.accessioned2019-06-14T10:53:50Z
dc.date.available2019-06-14T10:53:50Z
dc.date.created2016cs
dc.identifier.citationDRÁPELA, K. Strojové učení v oblasti stylometrie a určování autorství [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.cs
dc.identifier.other96460cs
dc.identifier.urihttp://hdl.handle.net/11012/62077
dc.description.abstractPráce se zabývá identifikací autorů anglických internetových komentářů. Popisuje aktuální stav v oboru určování autorství na sociálních sítích. Vysvětluje fungování a strukturu vytvořeného systému na určování autorství, který funguje na základě výběru nejinformativnějších příznaků z převážně písmemnných n-gramů a slovních druhů. Prezentuje výsledky testování systému na internetových službách Quora a Twitter.cs
dc.description.abstractThesis deals with authorship attribution of english internet comments. It describes state of art in authorship attribution on social networks. It decsribes how the new system created during the work on this thesis functions. System is based on selection of most informative characteristics mostly from character n-grams and part of speech tags. It presents results of testing on comments from social networks Quora and Twitter.en
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjecturčování autorstvícs
dc.subjectstrojové učenícs
dc.subjectvýběr příznakůcs
dc.subjectquoracs
dc.subjecttwittercs
dc.subjectauthorship attributionen
dc.subjectmachine learningen
dc.subjectfeature selectionen
dc.subjectquoraen
dc.subjecttwitteren
dc.titleStrojové učení v oblasti stylometrie a určování autorstvícs
dc.title.alternativeMachine Learning in the Domain of Stylometry and Authorship Attributionen
dc.typeTextcs
dcterms.dateAccepted2016-06-15cs
dcterms.modified2020-05-10-16:12:34cs
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
sync.item.dbid96460en
sync.item.dbtypeZPen
sync.item.insts2020.06.23 11:02:11en
sync.item.modts2020.06.23 10:00:31en
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
dc.contributor.refereeŠkoda, Petrcs
dc.description.markBcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
but.committeeprof. RNDr. Alexandr Meduna, CSc. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Jiří Jaroš, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Rozveďte význam charakteristiky písemných n-gramů a diskutujte jejich efekt na krátkých textech z Twitteru v porovnání s delšími texty. Stručně zdůvodněte příčinu lepších výsledků dosažených s metodou výběru příznaků "informační přínos" oproti jiným metodám.cs
but.resultpráce byla úspěšně obhájenacs
but.programInformační technologiecs
but.jazykčeština (Czech)


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record