Analýza dějových linií na základě shrnutí obsahu knih a uživatelských recenzí
Plot Analysis from Book Summaries and User Reviews

Author
Advisor
Smrž, PavelReferee
Dočekal, MartinGrade
CAltmetrics
Metadata
Show full item recordAbstract
Cieľom tejto práce je vytvoriť systém pre analýzu a klasifikáciu kľúčových dejových línií zo zhrnutých dejových zápletiek a užívateľských recenzií v anglickom jazyku. Zvolený problém je riešený pomocou techniky strojového učenia založenej na transformeroch. Vo vytvorenom riešení je implementované aj sťahovanie dát a bol vytvorený dataset užívateľských recenzií a informácií o knihách prevyšujúci 23 miliónov recenzií a takmer 900 tisíc informácií o knihách. Systém dokáže predikovať aké typy dejových zápletiek sa v dátach nachádzajú. The aim of this work is to create a system for analysis and classification of plot keywords from summarized storylines and user reviews in English. The chosen problem is solved using a transformer-based machine learning technique. The created solution also implements data downloading and a dataset of user reviews and information about books was created, exceeding 23 million reviews and 900 thousand information about books. The system can predict what plot keywords the data contains.
Keywords
spracovanie prirodzeného jazyka, strojové učenie, neurónové siete, bert, dejové línie, užívateľské recenzie, klasifikácia, multi-label, extrakcia dát z webu, natural language processing, machine learning, neural networks, bert, plots, user reviews, classification, multi-label, webscrapingLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen)Date of defence
2022-06-16Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Jaké jiné přístupy k určování podobnosti příběhů jste zvažoval? Jak jste zjišťoval falešně pozitivní výsledky? Odkud jste převzal 88 klíčových dějových linií? Hodnotil jste srozumitelnost a pochopitelnost dějových linií?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/207328Source
RÚČEK, P. Analýza dějových linií na základě shrnutí obsahu knih a uživatelských recenzí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.Collections
- 2022 [309]