Metody extrakce informace z textových dokumentů

but.committeecs
but.defencecs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBartík, Vladimírcs
dc.contributor.authorSychra, Tomášcs
dc.contributor.refereeBurget, Radekcs
dc.date.accessioned2019-05-17T07:18:34Z
dc.date.available2019-05-17T07:18:34Z
dc.date.created2008cs
dc.description.abstractZískávání znalostí z textových dokumentů představuje podmnožinu obecného získávání dat - dataminingu. Textové dokumenty však mají vlastnosti odlišné od běžných databází. Tato práce obsahuje přehled metod použitelných pro dolování informací z textů. Nejpoužívanější dolovací úlohou je klasifikace. Popíši možné přístupy při klasifikování dokumentů. V závěru představím algoritmus Winnow, který by měl při klasifikaci dosahovat dobrých výsledků v porovnání s ostatními algoritmy. Součástí práce je i popis implementace algoritmu Winnow a přehled dosažených výsledků.cs
dc.description.abstractKnowledge discovery in text documents is part of data mining. However, text documents have different properties in comparison to regular databases. This project contains an overview of methods for knowledge discovery in text documents. The most frequently used task in this area is document classification. Various approaches for text classification will be described. Finally, I will present algorithm Winnow that should perform better than any other algorithm for classification. There is a description of Winnow implementation and an overview of experimental results.en
dc.description.markAcs
dc.identifier.citationSYCHRA, T. Metody extrakce informace z textových dokumentů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2008.cs
dc.identifier.other25003cs
dc.identifier.urihttp://hdl.handle.net/11012/53244
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjecttextové dokumentycs
dc.subjectextrakcecs
dc.subjectextrakce informacecs
dc.subjectklasifikacecs
dc.subjectkategorizacecs
dc.subjectlineární klasifikacecs
dc.subjectWinnowcs
dc.subjectBalanced Winnowcs
dc.subjectPositive Winnowcs
dc.subjecttext documentsen
dc.subjectinformation extractionen
dc.subjectknowledge discoveryen
dc.subjectclassificationen
dc.subjectcategorizationen
dc.subjectlinear classificationen
dc.subjectWinnowen
dc.subjectBalanced Winnowen
dc.subjectPositive Winnowen
dc.titleMetody extrakce informace z textových dokumentůcs
dc.title.alternativeMethods for Information Extraction in Text Documentsen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2008-02-22cs
dcterms.modified2020-05-09-23:39:37cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid25003en
sync.item.dbtypeZPen
sync.item.insts2020.05.10 02:27:52en
sync.item.modts2020.05.10 01:43:47en
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.58 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_25003.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
review_25003.html
Collections