Statistický strojový překlad mezi češtinou a slovenštinou

Loading...
Thumbnail Image
Date
ORCID
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cílem téhle práce je navrhnout, implementovat a vyhodnotit úspěšnost vytvořeného systému pro překlad českých textů do slovenštiny. Popisuje teoretické základy statistického strojového překladu a pak samotnou fázi návrhu a vývoje systému. Zvolenou strategií bylo použít jeden rozsáhlý paralelní korpus v kombinaci s jazykovým modelem poskytovaným místním jazykovědným ústavem pro vytvoření překladového modelu založeném na frázích. Pro tenhle účel byl použit nástroj Moses. Experimentálně byl otestován také slovníkový překlad neznámých slov použitím stemmování. Úspěšnost systému byla vyhodnocena metrikou BLEU, přičemž dosažené výsledky byly porovnatelné s jinými systémy.
The aim of this thesis is to design, implement and evaluate the translation system capable of translating texts from Czech to Slovak language. It describes theoretical foundations of statistical machine translation and then the phase of design and development of system. The chosen strategy was to build phrase-based translation model using one large parallel corpus in combination with language model from local institute of linguistics. The statistical machine translation Moses was used to achieve this goal. The vocabulary translation of unknown words using stemming was proposed and tested. Precision of build system was evaluated with BLEU score and it achieved comparable results with other systems.
Description
Citation
ASTALOŠ, L. Statistický strojový překlad mezi češtinou a slovenštinou [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, CSc. (předseda) doc. RNDr. Pavel Smrž, Ph.D. (místopředseda) Ing. Radek Kočí, Ph.D. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)
Date of acceptance
2013-06-11
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: Jaký vliv má procentuální rozdělení datové sady na trénovací, validační a testovací část na výslednou úspěšnost překladače? Proč jste zvolil daný poměr?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO