Vyhledávání informací v textových datech
Information Retrieval in Text Data
Author
Advisor
Bartík, VladimírReferee
Burget, RadekGrade
BAltmetrics
Metadata
Show full item recordAbstract
Tato práce se zabývá problematikou dolování textových dat a vyhledávání informací. Práce popisuje nejčastější metody reprezentace textových dokumentů a strategie vyhledávání. Cílem práce je navržení a implementace aplikace, která bude provádět vyhledávání informací pomocí vektorového modelu. Aplikace realizuje tři způsoby výpočtu podobnosti: kosinovou míru, Jaccardův koeficient a Diceho koeficient. Výsledky dosažené pomocí těchto vztahů jsou porovnány a vyhodnoceny. Je nastíněno další pokračování projektu. This thesis researches the issue of text data mining and information retrieval. It describes the most common representations of text documents and retrieval strategies. The aim of this thesis is design and implementation of application, which realises information retrieval via vector space model. The application implements three different ways of similarity calculation: cosine measure, the Jaccard coefficient and the Dice coefficient. Achieved results are assessed. Possible continuance of the project is outlined.
Keywords
vyhledávání informací, vektorový model, relevance, dolování textových dat, kosinová míra, Jaccardův koeficient, Diceho koeficient, information retrieval, vector space model, relevance, text data mining, Cosine measure, Jaccard coefficient, Dice coefficientLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. Ing. Jiří Kunovský, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Bidlo, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen)Date of defence
2013-06-13Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Mohl byste blíže popsat použité testovací korpusy? Jaký je jejich původní účel? Byly publikovány nějaké srovnatelné experimentální výsledky nad těmito korpusy?Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/52883Source
TKADLČÍK, L. Vyhledávání informací v textových datech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.Collections
- 2013 [354]