Derivační morfologie češtiny na základě rozsáhlých korpusových dat
Derivational Morphology of Czech on Large Corpus Data

Author
Advisor
Smrž, PavelReferee
Dytrych, JaroslavGrade
AAltmetrics
Metadata
Show full item recordAbstract
Tématem této práce je zkoumání slovotvorby v českém jazyce. Hlavním cílem je vytvořit modul získávající derivace z dat elektronického Slovníku spisovné češtiny. Tato problematika byla vyřešena sestrojením tříúrovňového zpracování vycházejícího z dat slovníku. První úrovní je získání derivací z definic lemmat, druhým krokem je seskupení základních tvarů podle jejich podobností a třetí fází je ohodnocení získaných derivačních dvojic značkou derivační třídy, do které spadají. Zpracováním se podařilo získat více než 4 500 nových slov a ohodnotit nad 20 000 derivačních vazeb. Modul se stal plnohodnotnou součástí Morfologického analyzátoru Výzkumné skupiny znalostních technologií, působící na Fakultě informačních technologií Vysokého učení technického v Brně. Subject of this thesis is study of word formation in the Czech language. The main aim is to create a module acquiring derivations from data of the electronic Dictionary of the Czech Language. This problematics has been solved by constructing three-level processing based on dictionary data. The first level is to obtain derivations from lemma definitions, the second step is making groups of basic forms according to their similarities, and the third stage is the evaluation of derivation pairs by number tag of derivation class to which they belong. I have managed to get more than 4 500 new words and evaluate over 20 000 derivative couples. The module has become a full-fledged part of the Morphological Analyzer of the Knowledge Technology Research Group, working at the Faculty of Information Technology of the Brno University of Technology.
Keywords
český jazyk, morfologie, morfém, slovotvorba, derivace, sufixace, vnitřní lingvistika, vnější lingvistika, psycholingvistika, sociolingvistika, Slovník spisovné češtiny, derivační třídy, zahnízďování, czech language, morphology, morpheme, word-formation, derivation, suffixation, internal linguistics, external linguistics, psycholinguistics, sociolinguistics, Dictionary of Czech, derivative classes, nestingLanguage
čeština (Czech)Study brunch
Informační technologieComposition of Committee
doc. Ing. František Zbořil, CSc. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. RNDr. Dana Hliněná, Ph.D. (člen) Ing. Petr Matoušek, Ph.D. (člen) Ing. Marcela Zachariášová, Ph.D. (člen)Date of defence
2017-06-14Process of defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm " A ".Result of the defence
práce byla úspěšně obhájenaPersistent identifier
http://hdl.handle.net/11012/69664Source
FALTUSOVÁ, M. Derivační morfologie češtiny na základě rozsáhlých korpusových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2017.Collections
- 2017 [328]