Metody extrakce informace z textových dokumentů

Sychra, Tomáš

Metody extrakce informace z textových dokumentů

but.committee		cs
but.defence		cs
but.jazyk	čeština (Czech)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Bartík, Vladimír	cs
dc.contributor.author	Sychra, Tomáš	cs
dc.contributor.referee	Burget, Radek	cs
dc.date.accessioned	2019-05-17T07:18:34Z
dc.date.available	2019-05-17T07:18:34Z
dc.date.created	2008	cs
dc.description.abstract	Získávání znalostí z textových dokumentů představuje podmnožinu obecného získávání dat - dataminingu. Textové dokumenty však mají vlastnosti odlišné od běžných databází. Tato práce obsahuje přehled metod použitelných pro dolování informací z textů. Nejpoužívanější dolovací úlohou je klasifikace. Popíši možné přístupy při klasifikování dokumentů. V závěru představím algoritmus Winnow, který by měl při klasifikaci dosahovat dobrých výsledků v porovnání s ostatními algoritmy. Součástí práce je i popis implementace algoritmu Winnow a přehled dosažených výsledků.	cs
dc.description.abstract	Knowledge discovery in text documents is part of data mining. However, text documents have different properties in comparison to regular databases. This project contains an overview of methods for knowledge discovery in text documents. The most frequently used task in this area is document classification. Various approaches for text classification will be described. Finally, I will present algorithm Winnow that should perform better than any other algorithm for classification. There is a description of Winnow implementation and an overview of experimental results.	en
dc.description.mark	A	cs
dc.identifier.citation	SYCHRA, T. Metody extrakce informace z textových dokumentů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2008.	cs
dc.identifier.other	25003	cs
dc.identifier.uri	http://hdl.handle.net/11012/53244
dc.language.iso	cs	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	textové dokumenty	cs
dc.subject	extrakce	cs
dc.subject	extrakce informace	cs
dc.subject	klasifikace	cs
dc.subject	kategorizace	cs
dc.subject	lineární klasifikace	cs
dc.subject	Winnow	cs
dc.subject	Balanced Winnow	cs
dc.subject	Positive Winnow	cs
dc.subject	text documents	en
dc.subject	information extraction	en
dc.subject	knowledge discovery	en
dc.subject	classification	en
dc.subject	categorization	en
dc.subject	linear classification	en
dc.subject	Winnow	en
dc.subject	Balanced Winnow	en
dc.subject	Positive Winnow	en
dc.title	Metody extrakce informace z textových dokumentů	cs
dc.title.alternative	Methods for Information Extraction in Text Documents	en
dc.type	Text	cs
dc.type.driver	masterThesis	en
dc.type.evskp	diplomová práce	cs
dcterms.dateAccepted	2008-02-22	cs
dcterms.modified	2020-05-09-23:39:37	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	25003	en
sync.item.dbtype	ZP	en
sync.item.insts	2020.05.10 02:27:52	en
sync.item.modts	2020.05.10 01:43:47	en
thesis.discipline	Informační systémy	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů	cs
thesis.level	Inženýrský	cs
thesis.name	Ing.	cs

Files

Original bundle

Now showing 1 - 2 of 2

Name:: final-thesis.pdf
Size:: 1.58 MB
Format:: Adobe Portable Document Format
Description:: final-thesis.pdf

Download

Name:: review_25003.html
Size:: 1.44 KB
Format:: Hypertext Markup Language
Description:: review_25003.html

Download

Collections

2008