Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí
Increasing Classification Accuracy in libSVM Using String Kernel Functions

Переглянути
Автор
Advisor
Michlovský, ZbyněkReferee
Drozd, MichalGrade
AAltmetrics
Metadata
Показати повний опис матеріалуКороткий опис(реферат)
Práce se zabýva zkoumáním závislostí kvality klasifikace textových řetězců na vlastnostech vybraných řetězcových funkcí, použitých na určení míry podobnosti dvou textových řetezců. Práce přešetřuje též kombinování výsledků řetězcových funkcí aritmetickými operacemi plus a krát. Získané výsledky se v práci aplikují na detekci nevyžádané elektronické pošty. Publication aims to explore dependencies of text classification used with string kernel functions. String kernel functions are here used to retrieve rate of similarity between two text strings. There are described experiments with single string kernel function and also experiments with combinations of them with arithmetic operations of adition and multiplication. Gathered results are aplied to detect spam messages of e-mail communication.
Keywords
řetězcové funkce, libSVM, klasifikace, umělá inteligence, string kernel functions, libSVM, classification, artificial inteligenceLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. Ing. František Zbořil, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen)Date of defence
2010-06-14Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komisi byly přečteny posudky od vedoucího a oponenta práce. Student následně odpověděl na otázky oponenta a na doplňující otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Která z funkcí N-Gram a Gap-Weighted Subsequence rychleji určí míru podobnosti dvou řetězců a proč? Je funkce Bag of Word aplikovatelná na určení míry podobnosti v síťovém provozu? Co je to míra podobnosti dvou řetězců?Result of the defence
práce byla úspěšně obhájenaSource
HOMOLIAK, I. Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.Collections
- 2010 [347]