Derivační morfologie češtiny na základě rozsáhlých korpusových dat

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tématem této práce je zkoumání slovotvorby v českém jazyce. Hlavním cílem je vytvořit modul získávající derivace z dat elektronického Slovníku spisovné češtiny. Tato problematika byla vyřešena sestrojením tříúrovňového zpracování vycházejícího z dat slovníku. První úrovní je získání derivací z definic lemmat, druhým krokem je seskupení základních tvarů podle jejich podobností a třetí fází je ohodnocení získaných derivačních dvojic značkou derivační třídy, do které spadají. Zpracováním se podařilo získat více než 4 500 nových slov a ohodnotit nad 20 000 derivačních vazeb. Modul se stal plnohodnotnou součástí Morfologického analyzátoru Výzkumné skupiny znalostních technologií, působící na Fakultě informačních technologií Vysokého učení technického v Brně.
Subject of this thesis is study of word formation in the Czech language. The main aim is to create a module acquiring derivations from data of the electronic Dictionary of the Czech Language. This problematics has been solved by constructing three-level processing based on dictionary data. The first level is to obtain derivations from lemma definitions, the second step is making groups of basic forms according to their similarities, and the third stage is the evaluation of derivation pairs by number tag of derivation class to which they belong. I have managed to get more than 4 500 new words and evaluate over 20 000 derivative couples. The module has become a full-fledged part of the Morphological Analyzer of the Knowledge Technology Research Group, working at the Faculty of Information Technology of the Brno University of Technology.
Description
Citation
FALTUSOVÁ, M. Derivační morfologie češtiny na základě rozsáhlých korpusových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2017.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. RNDr. Dana Hliněná, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen) Ing. Marcela Zachariášová, Ph.D. (člen)
Date of acceptance
2017-06-14
Defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm " A ".
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO