Expertní systém pro rozhodování na akciových trzích s využitím sentimentu investorů

Abstract
Předložená disertační práce zkoumá potenciál využití skóre sentimentu extrahovaného z textových dat společně s historickými daty o akciovém indexu ke zlepšení výkonnosti predikce na akciovém trhu prostřednictvím vytvořeného modelu expertního systému. Vzhledem k tomu, že velké množství textových dokumentů souvisejících s financemi, které zveřejňují jak profesionální, tak amatérští investoři, nejen na online sociálních sítích, by mohly mít dopad na vývoj akciových trhů, je zásadním úkolem analyzovat finanční texty zveřejněné různými uživateli a zejména z nich extrahovat sentiment. V této práci je sentiment investorů získán z online finančních zpráv a příspěvků zveřejněných na finanční sociální platformě StockTwits. Skóre sentimentu je stanoveno pomocí hybridního přístupu kombinující modely strojového učení s učitelem a neuronových sítí, přičemž ke klasifikaci polarity sentimentu je využito vícero lexikonů pozitivních a negativních slov. Je analyzován vliv skóre sentimentu na akciový trh prostřednictvím kauzality, kointegrace a koherence. V disertační práci je navržen model expertního systému založený na metodách fuzzy logiky. Fuzzy logika poskytuje pozoruhodné vlastnosti při práci s vágními, nepřesnými či nejasnými údaji a je schopna se lépe vypořádat s chaotickým prostředím na akciových trzích. V nedávných vědeckých studiích na popularitě získává vyšší úroveň fuzzy logiky, která je označována jako type-2 fuzzy logika. Oproti klasické type-1 fuzzy logice, je tento vyšší typ schopen mezi zdvojené funkce členství integrovat určitou úroveň nejistoty. Tento typ expertního systému je ovšem v předmětné problematice predikce akciového trhu s využitím extrahovaného sentimentu investorů značně opomíjen. Z toho důvodu je v disertační práci zkoumán potenciál využít a výkonnost type-2 fuzzy logiky. Konkrétně je vytvořeno několik type-2 fuzzy modelů, které jsou trénovány na historických datech akciového indexu a skóre sentimentu investorů za období 2018-2020. Vytvořené modely jsou posouzeny k měření výkonu predikce bez sentimentu i s integrací sentimentu investorů. Následně je na základě vytvořeného expertního modelu stanovena investiční strategie a sledována jeho ziskovost. Výkonnost predikce fuzzy modelů je komparována s výkonností několika srovnávacích modelů, včetně SVM, k-NN, naivního Bayes a dalších. Z experimentů vyplynulo, že modely fuzzy logiky jsou schopny vhodným nastavením funkcí členství a nejistoty v nich obsažených vylepšit predikci a jsou schopny konkurovat klasickým modelům predikce, které jsou standardně využívané ve výzkumných studiích. Vytvořený model by měl také sloužit jako nástroj pro podporu investičního rozhodování individuálním investorům.
The presented dissertation examines the potential of using the sentiment score extracted from textual data with historical stock index data to improve the performance of stock market prediction through the created model of the expert system. Given the large number of financial-related text documents published by both professional and amateur investors, not only on online social networks that could have an impact on real stock markets, but it is also crucial to analyze and in particular extract financial texts published by different users. investor sentiment. In this work, investor sentiment is obtained from online financial reports and contributions published on the financial social platform StockTwits. Sentiment scores are determined using a hybrid approach combining machine learning models with the teacher and neural networks, with multiple lexicons of positive and negative words used to classify sentiment polarity. The influence of sentiment score on the stock market through causality, cointegration and coherence is analyzed. The dissertation proposes a model of an expert system based on fuzzy logic methods. Fuzzy logic provides remarkable features when working with vague, inaccurate or unclear data and is able to deal with the chaotic environment of stock markets. In recent scientific studies, it has gained in popularity a higher level of fuzzy logic, which is referred to as type-2 fuzzy logic. Unlike the classic type-1 fuzzy logic, this higher type is able to integrate a certain level of uncertainty between the dual membership functions. However, this type of expert system is considerably neglected in the subject issue of stock market prediction using the extracted investor sentiment. For this reason, the dissertation examines the potential to use and the performance of type-2 fuzzy logic. Specifically, several type-2 fuzzy models are created. which are trained on historical stock index data and sentiment scores extracted from text data for the period 2018-2020. The created models are assessed to measure the prediction performance without sentiment and with the integration of investor sentiment. Subsequently, based on the created expert model, the investment strategy is determined, and its profitability is monitored. The prediction performance of fuzzy models is compared with the performance of several comparison models, including SVM, KNN, naive Bayes and others. It has been observed from experiments that fuzzy logic models are able to improve prediction by appropriate setting of membership and uncertainty functions contained in them and are able to compete with classical expert prediction models, which are standardly used in research studies. The created model should serve as a tool to support investment decisions for individual investors.
Description
Citation
JANKOVÁ, Z. Expertní systém pro rozhodování na akciových trzích s využitím sentimentu investorů [online]. Brno: Vysoké učení technické v Brně. Fakulta podnikatelská. 2021.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Řízení a ekonomika podniku
Comittee
prof. Ing. et Ing. Stanislav Škapa, Ph.D. (předseda) doc. Ing. Bronislav Chramcov, Ph.D. (člen) prof. Ing. Vojtěch Koráb, Dr., MBA (člen) doc. Ing. Eva Lajtkepová, Ph.D. (člen) prof. Ing. Radim Lenort, Ph.D. (člen) doc. RNDr. Bedřich Půža, CSc. (člen) doc. Ing. Marek Zinecker, Ph.D. (člen)
Date of acceptance
2021-11-04
Defence
otázky oponenta: - V kapitole 1.4.1 Fuzzy Logika uvádíte na straně 63: „Jestliže jsou naměřená data perfektní, modelují se jako ostrá množina, data se šumem a data se stacionárním šumem se modelují jako type-1 fuzzy množiny, s nestacionárním šumem se modelují jako type-2 fuzzy množiny“. Můžete vysvětlit co chápete pod pojmem data se stacionárním a nestacionárním šumem? - Jak uvádíte v kapitole 4.1.2 základními zdroji textových dat pro analýzu sentimentu byly oficiální weby CNBC, Guardian a Reuters. Studovala jste také míru vlivu jednotlivých zdrojů (tzn. ovlivňuje některý ze zdrojů výsledný sentiment významněji než druhý)? Uvažovala jste nad zařazením dalších zdrojů do analýzy sentimentu? - U sociálních sítí pracujete výhradně se sítí „StockTwits“. Existují ještě další alternativy, které by se daly použít k doplnění analýzy názorového sentimentu? - Objevují se na použitých zpravodajských webech či sociální síti zavádějící, falešné či mylné informace, které mají investory zmást? Pokud ano, jsou tyto zprávy nějakým způsobem filtrovány? - V kapitole 4.3.1. řešíte analýzu sentimentu na zvolených lexikonech. Můžete uvést důvody proč výsledky klasifikace sentimentu (viz analýza dle ROC křivky – Obr. 4.12) dle všech použitých metod jsou výrazně horší u finančního slovníku Loughran-McDonald? - Jak byly v práci konkrétně použity výstupy bibliometrické analýzy, zejména pak analýzy výskytu klíčových slov a kocitací časopisů? Jaká je vazba mezi výstupy bibliometrické analýzy a výběrem 251 publikací pro obsahovou analýzu? Proč nebylo pro obsahovou analýzu použito 167 publikací identifikovaných analýzou kocitací dokumentů? Které výstupy bibliometrické analýzy byly použity ke kritickému zhodnocení dosavadních poznatků a definování výzkumných otázek a hypotéz? - Jak by aplikace navrženého expertního modelu v praxi vypadala? Nebude celý proces predikce příliš dlouhý (delší než jednodenní zpoždění predikce), zejména díky časově náročné extrakci sentimentu z textových dat? Lze celý proces predikce plně automatizovat? Lze vyřešit uvedený problém použitím superpočítače? - Lze pro investory jednoznačně definovat podmínky, za kterých je vhodné doporučit aplikaci navrženého expertního modelu a celé metodiky predikce ve srovnání se standardně užívanými modely predikce vývoje akciového trhu? Např. podmínka aplikace modelu v případě, že lze očekávat zásadní propady trhu? - Vedle globálních sociálních sítí, primárně v anglické jazykové verzi, lze zaznamenat růst významu lokálních sítí, jejichž vliv na chování investorů roste vzhledem ke kontinuálnímu posilování významu zejména asijských ekonomik. V jaké podobě může nastíněný vývoj ovlivnit výsledky předkládané v této disertační práci, resp. další výzkumné směry v dané oblasti? - V kapitole 6.2 jsou zmiňovány přínosy pro praxi. Zvažuje nebo zvažovala autorka možnost nabídnout výzkumné poznatky některé z profesionálních investičních společností, např. v rámci projektů smluvního výzkumu?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO