Klasifikace dokumentů podle tématu

but.committeeprof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. Ing. Tomáš Vojnar, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) prof. Ing. Martin Drahanský, Ph.D. (člen) Ing. Tomáš Martínek, Ph.D. (člen) doc. Ing. Jan Staudek, CSc. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Diskutujte příčiny pozitivního vlivu příznaku "celá e-mailová adresa" v bayesovském klasifikátoru, když vliv příznaků týkajících se samotné existence e-mailové adresy v textu byl negativní.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorOtrusina, Lubomírcs
dc.contributor.authorMarek, Tomášcs
dc.contributor.refereeŠkoda, Petrcs
dc.date.accessioned2020-06-23T07:13:09Z
dc.date.available2020-06-23T07:13:09Z
dc.date.created2013cs
dc.description.abstractTato práce se zabývá problematikou klasifikace textových dokumentů, a to především metodami klasifikace textu. Hlavním cílem této práce je rozebrat dva algoritmy pro klasifikaci dokumentů, implementovat je a následně porovnat. Byl zvoleny algoritmy Bayesovského klasifikátoru a klasifikátoru založeného na metodě support vector machines (SVM), které jsou v této práci podrobně analyzovány a popsány. Jedním z cílů této práce bylo optimálně vytvořit a vybrat příznaky, které by co nejvíce napomohly klasifikaci textu. V závěru práce je provedeno množství testů, ukazujících účinnost obou klasifikátorů za různých podmínek.cs
dc.description.abstractThis thesis deals with a document classification, especially with a text classification method. Main goal of this thesis is to analyze two arbitrary document classification algorithms to describe them and to create an implementation of those algorithms. Chosen algorithms are Bayes classifier and classifier based on support vector machines (SVM) which were analyzed and implemented in the practical part of this thesis. One of the main goals of this thesis is to create and choose optimal text features, which are describing the input text best and thus lead to the best classification results. At the end of this thesis there is a bunch of tests showing comparison of efficiency of the chosen classifiers under various conditions.en
dc.description.markCcs
dc.identifier.citationMAREK, T. Klasifikace dokumentů podle tématu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.cs
dc.identifier.other79632cs
dc.identifier.urihttp://hdl.handle.net/11012/53401
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectklasifikacecs
dc.subjectBayesovský klasifikátorcs
dc.subjectBayesovský teorémcs
dc.subjectSVM klasifikátorcs
dc.subjectSVMcs
dc.subjectjaderné metodycs
dc.subjectvolba parametrů SVMcs
dc.subjectsimulované žíhánícs
dc.subjectklasifikace přirozeného jazykacs
dc.subjectstrojové učenícs
dc.subjectzpracování přirozeného jazykacs
dc.subjectpříznakycs
dc.subjectclassificationen
dc.subjectBayes classifieren
dc.subjectBayes' theoremen
dc.subjectSVM classifieren
dc.subjectSVMen
dc.subjectkernel methodsen
dc.subjectchoosing SVM classifier parametersen
dc.subjectsimulated annealingen
dc.subjectnatural language classificationen
dc.subjectmachine learningen
dc.subjectnatural language processingen
dc.subjectfeaturesen
dc.titleKlasifikace dokumentů podle tématucs
dc.title.alternativeDocument Classificationen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2013-06-19cs
dcterms.modified2020-05-10-16:11:26cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid79632en
sync.item.dbtypeZPen
sync.item.insts2021.11.10 13:08:00en
sync.item.modts2021.11.10 12:27:52en
thesis.disciplineBioinformatika a biocomputingcs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
489.25 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_79632.html
Size:
1.43 KB
Format:
Hypertext Markup Language
Description:
review_79632.html
Collections