• čeština
    • English
    • русский
    • Deutsch
    • français
    • polski
    • українська
  • English 
    • čeština
    • English
    • русский
    • Deutsch
    • français
    • polski
    • українська
  • Login
View Item 
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta informačních technologií
  • 2013
  • View Item
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta informačních technologií
  • 2013
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Vyhledávání informací v textových datech

Information Retrieval in Text Data

Thumbnail
View/Open
review_78909.html (1.444Kb)
final-thesis.pdf (448.7Kb)
Author
Tkadlčík, Luboš
Advisor
Bartík, Vladimír
Referee
Burget, Radek
Grade
B
Altmetrics
Metadata
Show full item record
Abstract
Tato práce se zabývá problematikou dolování textových dat a vyhledávání informací. Práce popisuje nejčastější metody reprezentace textových dokumentů a strategie vyhledávání. Cílem práce je navržení a implementace aplikace, která bude provádět vyhledávání informací pomocí vektorového modelu. Aplikace realizuje tři způsoby výpočtu podobnosti: kosinovou míru, Jaccardův koeficient a Diceho koeficient. Výsledky dosažené pomocí těchto vztahů jsou porovnány a vyhodnoceny. Je nastíněno další pokračování projektu.
 
This thesis researches the issue of text data mining and information retrieval. It describes the most common representations of text documents and retrieval strategies. The aim of this thesis is design and implementation of application, which realises information retrieval via vector space model. The application implements three different ways of similarity calculation: cosine measure, the Jaccard coefficient and the Dice coefficient. Achieved results are assessed. Possible continuance of the project is outlined.
 
Keywords
vyhledávání informací, vektorový model, relevance, dolování textových dat, kosinová míra, Jaccardův koeficient, Diceho koeficient, information retrieval, vector space model, relevance, text data mining, Cosine measure, Jaccard coefficient, Dice coefficient
Language
čeština (Czech)
Study brunch
Informační technologie
Composition of Committee
doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. Ing. Jiří Kunovský, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Bidlo, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen)
Date of defence
2013-06-13
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Mohl byste blíže popsat použité testovací korpusy? Jaký je jejich původní účel? Byly publikovány nějaké srovnatelné experimentální výsledky nad těmito korpusy?
Result of the defence
práce byla úspěšně obhájena
Persistent identifier
http://hdl.handle.net/11012/52883
Source
TKADLČÍK, L. Vyhledávání informací v textových datech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.
Collections
  • 2013 [354]
Citace PRO

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV
 

 

Browse

All of repositoryCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Statistics

View Usage Statistics

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV