Strojové učení v oblasti stylometrie a určování autorství

Loading...
Thumbnail Image
Date
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Práce se zabývá identifikací autorů anglických internetových komentářů. Popisuje aktuální stav v oboru určování autorství na sociálních sítích. Vysvětluje fungování a strukturu vytvořeného systému na určování autorství, který funguje na základě výběru nejinformativnějších příznaků z převážně písmemnných n-gramů a slovních druhů. Prezentuje výsledky testování systému na internetových službách Quora a Twitter.
Thesis deals with authorship attribution of english internet comments. It describes state of art in authorship attribution on social networks. It decsribes how the new system created during the work on this thesis functions. System is based on selection of most informative characteristics mostly from character n-grams and part of speech tags. It presents results of testing on comments from social networks Quora and Twitter.
Description
Citation
DRÁPELA, K. Strojové učení v oblasti stylometrie a určování autorství [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
prof. RNDr. Alexandr Meduna, CSc. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Jiří Jaroš, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)
Date of acceptance
2016-06-15
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Rozveďte význam charakteristiky písemných n-gramů a diskutujte jejich efekt na krátkých textech z Twitteru v porovnání s delšími texty. Stručně zdůvodněte příčinu lepších výsledků dosažených s metodou výběru příznaků "informační přínos" oproti jiným metodám.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO