Vícejazyčný systém pro odpovídání na otázky nad otevřenou doménou

but.committeedoc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Martin Čadík, Ph.D. (místopředseda) Ing. David Bařina, Ph.D. (člen) doc. Ing. Lukáš Burget, Ph.D. (člen) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Jak si vysvětlujete, že se lepší výkon překladače, hodnoceného podle BLEU, neprojevuje na lepších výsledcích, přestože přímo použití lidského překladu pozitivní vliv má. Můžete blíže popsat svoji implementaci?cs
but.jazykangličtina (English)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorFajčík, Martinen
dc.contributor.authorSlávka, Michalen
dc.contributor.refereeDočekal, Martinen
dc.date.accessioned2021-06-25T07:55:34Z
dc.date.available2021-06-25T07:55:34Z
dc.date.created2021cs
dc.description.abstractTáto práca sa zaoberá automatickým viacjazyčným zodpovedaním na otázky v otvorenej doméne. V tejto práci sú navrhnuté prístupy k tejto málo prebádanej doméne. Konkrétne skúma, či: (i) použitie prekladu z angličtiny je dostačujúce, (ii) multilinguálne systémy vedia využiť preklad otázky do iných jazykov (iii) alebo je výhodnejšie nepoužívať žiaden preklad. Porovnávam použitie anglického systému založeného na modeli T5, ktorý využíva strojový preklad s natívne viacjazyčnými systémami založenými na viacjazyčnom modeli MT5. Anglický systém so strojovým prekladom mierne prekonáva svoje jednojazyčné náprotivky vo viacerých úlohách. Napriek tomu, že tento model bol natrénovaný na väčšom množstve dát zlepšenie nie je dostatočne signifikantné. To ukazuje, že použitie natívne viacjazyčných systémov je sľubným prístupom pre budúci výskum. Tiež prezentujem metódu získavania dokumentov v rôznych jazykoch pomocou algoritmu BM25 a porovnávam ju s anglickým retrievalom. Používanie viacjazyčných dôkazov sa javí ako prospešné a zlepšuje výkonnosť systému systémov.en
dc.description.abstractThis thesis explores automatic Multilingual Open-Domain Question Answering. In this work are proposed approaches to this less explored research area. More precisely, this work examines if: (i) utilization of an English system is sufficient, (ii) multilingual models can benefit from a translated question into other languages (iii) or avoiding translation is a better choice. English system based on the T5 model that uses a machine translation is compared to natively multilingual systems based on the multilingual MT5 model. The English system with machine translation only slightly outperforms its monolingual counterparts in multiple tasks. Compared to multilingual models, the English system was trained on a much larger dataset, but the results were comparable. This shows that the use of natively multilingual systems is a promising approach for future research. I also present a method of retrieving multilingual evidence using the BM25 ranking algorithm and compare it with English retrieval. The use of multilingual evidence seems to be beneficial and improves the performance of the systems.cs
dc.description.markCcs
dc.identifier.citationSLÁVKA, M. Vícejazyčný systém pro odpovídání na otázky nad otevřenou doménou [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.cs
dc.identifier.other136746cs
dc.identifier.urihttp://hdl.handle.net/11012/200123
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectSpracovanie Prirodzeného jazykaen
dc.subjectAutomatické Odpovedanie na Otázkyen
dc.subjectZískavanie Informáciíen
dc.subjectBM25en
dc.subjectTransformers Referenceen
dc.subjectNatural Language Processingcs
dc.subjectQuestion Answeringcs
dc.subjectInformation Retrievalcs
dc.subjectMultilingualcs
dc.subjectBM25cs
dc.subjectTransformerscs
dc.titleVícejazyčný systém pro odpovídání na otázky nad otevřenou doménouen
dc.title.alternativeMultilingual Open-Domain Question Answeringcs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2021-06-23cs
dcterms.modified2021-06-24-11:35:09cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid136746en
sync.item.dbtypeZPen
sync.item.insts2021.11.23 01:03:01en
sync.item.modts2021.11.22 23:56:45en
thesis.disciplineStrojové učenícs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
4.34 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-23369_v.pdf
Size:
85.62 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-23369_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-23369_o.pdf
Size:
89.3 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-23369_o.pdf
Loading...
Thumbnail Image
Name:
review_136746.html
Size:
1.47 KB
Format:
Hypertext Markup Language
Description:
review_136746.html
Collections