Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Práce se zabýva zkoumáním závislostí kvality klasifikace textových řetězců na vlastnostech vybraných řetězcových funkcí, použitých na určení míry podobnosti dvou textových řetezců. Práce přešetřuje též kombinování výsledků řetězcových funkcí aritmetickými operacemi plus a krát. Získané výsledky se v práci aplikují na detekci nevyžádané elektronické pošty.
Publication aims to explore dependencies of text classification used with string kernel functions. String kernel functions are here used to retrieve rate of similarity between two text strings. There are described experiments with single string kernel function and also experiments with combinations of them with arithmetic operations of adition and multiplication. Gathered results are aplied to detect spam messages of e-mail communication.
Description
Citation
HOMOLIAK, I. Zvýšení úspěšnosti klasifikace v libSVM s použitím řetězcových fukcí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) Ing. Radek Kočí, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen)
Date of acceptance
2010-06-14
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komisi byly přečteny posudky od vedoucího a oponenta práce. Student následně odpověděl na otázky oponenta a na doplňující otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Která z funkcí N-Gram a Gap-Weighted Subsequence rychleji určí míru podobnosti dvou řetězců a proč? Je funkce Bag of Word aplikovatelná na určení míry podobnosti v síťovém provozu? Co je to míra podobnosti dvou řetězců?
Result of defence
práce byla úspěšně obhájena
Document licence
Přístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 5 roku/let
DOI
Collections
Citace PRO