Automatizovaná detekce ofenzivního jazyka a nenávistných projevů v přirozeném jazyce

Štajerová, Alžbeta

Automatizovaná detekce ofenzivního jazyka a nenávistných projevů v přirozeném jazyce

Mark

A

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

Abstract

Táto práca sa zaoberá fenoménom nenávistných prejavov a ofenzívneho jazyka, ich definíciami a detekciou. Popisuje metódy doterajšieho riešenia detekcie. Zhodnocuje dostupné dátové sady využiteľné pri trénovaní modelov zameraných na detekciu tohto fenoménu. Dáva si za cieľ uviesť ďalšie metódy riešenia detekcie tohto problému a porovnanie ich výsledkov a vyhodnotenie úspešnosti. Zvolený problém bol riešený piatimi modelmi. Dva z nich boli zamerané na extrakciu príznakov a ich následnú klasifikáciu. Ďalšie tri boli riešené pomocou neurónových sietí. Úspešnosť implementovaných modelov som experimentálne vyhodnotila. Výsledky tejto práce umožňujú porovnanie typických prístupov s metódami využívajúcimi najnovšie poznatky z oblasti strojového učenia použitých pre klasifikáciu nenávistného a ofenzívneho jazyka.
This thesis discusses hate speech and offensive language phenomenon, their respective definitions and their occurrence in natural language. It describes previously used methods of solving the detection. An evaluation of available data sets suitable for the problem of detection is provided. The thesis aims to provide additional methods of solving the detection of this issue and it compares the results of these methods. Five models were selected in total. Two of them are focused on feature extraction and the remaining three are neural network models. I have experimentally evaluated the success of the implemented models. The results of this thesis allow for comparison of the typical approaches with the methods leveraging the newest findings in terms of machine learning that are used for the classification of hate speech and offensive language.

Keywords

spracovanie prirodzeného jazyka, ofenzívny jazyk, nenávistný prejav, klasifikácia, strojové učenie, detekcia, spracovanie textu, natural language processing, offensive language, hate speech, classification, machine learning, detection, text processing

Citation

ŠTAJEROVÁ, A. Automatizovaná detekce ofenzivního jazyka a nenávistných projevů v přirozeném jazyce [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.

Language of document

cs

Study field

Informační technologie

Comittee

doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Dana Hliněná, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)

Date of acceptance

2019-06-14

Defence

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Dělají testované modely podobné chyby nebo se jejich rozhodnutí výrazně liší? Bylo by možné kombinací více modelů získat lepší výsledky? Nastiňte možné budoucí směry, kterými by šla práce dále rozvíjet a vylepšovat.

Result of defence

práce byla úspěšně obhájena

Document licence

Standardní licenční smlouva - přístup k plnému textu bez omezení

URI

http://hdl.handle.net/11012/180134

Collections

2019

Citace PRO

Full item page