• čeština
    • English
    • русский
    • Deutsch
    • français
    • polski
    • українська
  • English 
    • čeština
    • English
    • русский
    • Deutsch
    • français
    • polski
    • українська
  • Login
View Item 
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta informačních technologií
  • 2022
  • View Item
  •   Repository Home
  • Závěrečné práce
  • bakalářské práce
  • Fakulta informačních technologií
  • 2022
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Zjednoznačňování pojmenovaných entit ve slovenštině

Named Entity Disambiguation in Slovak

Thumbnail
View/Open
review_145146.html (1.454Kb)
final-thesis.pdf (4.748Mb)
Posudek-Vedouci prace-24563_v.pdf (86.33Kb)
Posudek-Oponent prace-24563_o.pdf (90.43Kb)
Author
Križan, Samuel
Advisor
Smrž, Pavel
Referee
Otrusina, Lubomír
Grade
D
Altmetrics
Metadata
Show full item record
Abstract
Práca sa zaoberá rozpoznávaním a zjednoznačňovaním pomenovaných entít. V rámci práce bol vytvorený základný systém obsahujúci všetky prerekvizity potrebné pre zjednoznačňovanie pomenovaných entít v slovenčine. Súčasťou systému je vytvorenie znalostnej bázy z exportu slovenskej Wikipédie. Tá bola následne porovnávaná so znalostnou bázou z Wikidát, čím sa zistilo, že hlavným prínosom použitia znalostnej bázy z Wikipédie pre slovenčinu je väčšie pokrytie entitami s odkazom na slovenskú Wikipédiu a lepšie určovanie tried entít. Okrem toho bola vykonaná aj aktualizácia morfologického slovníka výskumnej skupiny KNOT@FIT, ktorá priniesla zlepšenie v rozsahu 33-39 %. Práca predpokladá možné využitie v spojitosti s rozšírením systému o zjednoznačňovací modul a zlepšením pokrytia alternatívnych pomenovaní.
 
Thesis deals with the topic of named entity recognition and disambiguation. A basic system was created which includes all prequisitions necessary for named entity disambiguation in Slovak language. Part of the system is building of a knowledge base out of an export from Slovak Wikipedia. This was subsequently compared to knowledge base obtained from Wikidata, which revealed that the main contribution of Wikipedia knowledge base for Slovak language is greater coverage of entities with link to Slovak Wikipedia and better determination of entity classes. Apart from that, morfological dictionary of KNOT@FIT research group was updated, which yielded an improvement by 33-39 %. This work presumes possible utilization in relation to system extention by a disambiguation modul and enhancement of alternative names coverage.
 
Keywords
pomenovaná entita, rozpoznávanie pomenovaných entít, zjednoznačňovanie pomenovaných entít, znalostná báza, Wikipédia, extrakcia informácií, named entity, named entity recognition, named entity disambiguation, knowledge base, Wikipedia, information extraction
Language
čeština (Czech)
Study brunch
Informační technologie
Composition of Committee
doc. Ing. František Zbořil, Ph.D. (předseda) doc. Mgr. Adam Rogalewicz, Ph.D. (místopředseda) Ing. David Bařina, Ph.D. (člen) Ing. Jiří Hynek, Ph.D. (člen) Ing. Lukáš Kekely, Ph.D. (člen)
Date of defence
2022-06-15
Process of defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Na straně 20 píšete, že při tvorbě znalostní báze dochází k přetěžování API Wikipedie. Proč tedy používáte API a nezískáváte potřebné informace z offline souborů, které by pro Vaše potřeby měly být dostupné? Na straně 25 uvádíte, že při aktualizaci znalostní báze přidáváte unikátní entity ze staré verze Wikipedie do nové verze. Nemůže mít jejich odstranění racionální důvod (např. porušení pravidel Wikipedie)? Můžete porotě ukázat několik příkladů odstranění entit z Wikipedie a uvést pravděpodobné důvody, proč k tomu došlo? Jaký je vztah mezi češtinou a slovenštinou z hlediska morfologie?
Result of the defence
práce byla úspěšně obhájena
Persistent identifier
http://hdl.handle.net/11012/207283
Source
KRIŽAN, S. Zjednoznačňování pojmenovaných entit ve slovenštině [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.
Collections
  • 2022 [309]
Citace PRO

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV
 

 

Browse

All of repositoryCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

LoginRegister

Statistics

View Usage Statistics

Portal of libraries | Central library on Facebook
DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback | Theme by @mire NV