Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí
Increasing Classification Accuracy in libSVM Using String Kernel Functions

Zobrazit/ otevřít
Autor
Vedoucí práce
Michlovský, ZbyněkOponent
Drozd, MichalKlasifikace
AAltmetrics
Metadata
Zobrazit celý záznamAbstrakt
Práce se zabýva zkoumáním závislostí kvality klasifikace textových řetězců na vlastnostech vybraných řetězcových funkcí, použitých na určení míry podobnosti dvou textových řetezců. Práce přešetřuje též kombinování výsledků řetězcových funkcí aritmetickými operacemi plus a krát. Získané výsledky se v práci aplikují na detekci nevyžádané elektronické pošty. Publication aims to explore dependencies of text classification used with string kernel functions. String kernel functions are here used to retrieve rate of similarity between two text strings. There are described experiments with single string kernel function and also experiments with combinations of them with arithmetic operations of adition and multiplication. Gathered results are aplied to detect spam messages of e-mail communication.
Klíčová slova
řetězcové funkce, libSVM, klasifikace, umělá inteligence, string kernel functions, libSVM, classification, artificial inteligenceJazyk
čeština (Czech)Studijní obor
Informační technologieSložení komise
doc. Ing. František Zbořil, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen)Termín obhajoby
2010-06-14Průběh obhajoby
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komisi byly přečteny posudky od vedoucího a oponenta práce. Student následně odpověděl na otázky oponenta a na doplňující otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Která z funkcí N-Gram a Gap-Weighted Subsequence rychleji určí míru podobnosti dvou řetězců a proč? Je funkce Bag of Word aplikovatelná na určení míry podobnosti v síťovém provozu? Co je to míra podobnosti dvou řetězců?Výsledek obhajoby
práce byla úspěšně obhájenaTrvalý odkaz
http://hdl.handle.net/11012/55997Zdrojový dokument
HOMOLIAK, I. Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.Kolekce
- 2010 [347]