Databáze XML pro správu slovníkových dat

Loading...
Thumbnail Image
Date
ORCID
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Práce se zabývá automatizací zpracování slovníkových dat, především těch ve formátech postavených na XML. Čtenář je nejprve seznámen s použitými pojmy lingvistiky a lexikografie, dále jsou představeny jednotlivé typy formátů lexikografických dat a konkrétní formáty a diskutovány jejich výhody a nevýhody. Z nich je vybrán na základě určitých kritérií formát LMF a pro něj navržena a realizována aplikace v Pythonu zaměřená především na inteligentní spojování více slovníků do jednoho. Tato aplikace byla poté, co prošla všemi jednotkovými testy, použita také pro zpracování LMF slovníků, které jsou uloženy na školním serveru výzkumné skupiny pro zpracování přirozeného jazyka. Na závěr jsou diskutovány výhody a nevýhody takto navržené a implementované aplikace a nastíněny možnosti dalšího použití a rozšiřování.
The following diploma thesis deals with dictionary data processing, especially those in XML based formats. At first, the reader is acquainted with linguistic and lexicographical terms used in this work. Then particular lexicographical data format types and specific formats are introduced. Their advantages and disadvantages are discussed as well. According to previously set criteria, the LMF format has been chosen for design and implementation of Python application, which focuses especially on intelligent merging of more dictionaries into one. After passing all unit tests, this application has been used for processing LMF dictionaries, located on the faculty server of the research group for natural language processing. Finally, the advantages and disadvantages of this application are discussed and ways of further usage and extension are suggested.
Description
Citation
SAMIA, M. Databáze XML pro správu slovníkových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační systémy
Comittee
prof. Ing. Tomáš Hruška, CSc. (předseda) doc. Ing. Přemysl Kršek, Ph.D. (místopředseda) prof. Ing. Mária Bieliková, Ph.D. (člen) prof. RNDr. Milan Češka, CSc. (člen) RNDr. Marek Rychlý, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen)
Date of acceptance
2011-06-22
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ".
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO