search query: @supervisor Hyvönen, Eero / total: 40
reference: 2 / 40
« previous | next »
Author:Tamper, Minna
Title:Extraction of Entities and Concepts from Finnish Texts
Entiteettien ja käsitteiden eristäminen suomenkielisistä teksteistä
Publication type:Master's thesis
Publication year:2016
Pages:(7) + 72 s. + liitt. 17      Language:   eng
Department/School:Perustieteiden korkeakoulu
Main subject:Computer Science   (SCI3042)
Supervisor:Hyvönen, Eero
Instructor:Mäkelä, Eetu ; Tuominen, Jouni
Electronic version URL: http://urn.fi/URN:NBN:fi:aalto-201612226282
Location:P1 Ark Aalto  5927   | Archive
Keywords:automatic annotation
linked open data
named entity linking
ontologies
automaattinen asiasanoitus
avoin linkitetty data
entiteettien linkitys
ontologiat
Abstract (eng):Keywords are used in many document databases to improve search.
The process of assigning keywords from controlled vocabularies to a document is called subject indexing.
If the controlled vocabulary used for indexing is an ontology, with semantic relations and descriptions of concepts, the process is also called semantic annotation.

In this thesis an automatic annotation tool was created to provide the documents with semantic annotations.
The application links entities found from the texts to ontologies defined by the user.
The application is highly configurable and can be used with different Finnish texts.
The application was developed as a part of WarSampo and Semantic Finlex projects and tested using Kansa Taisteli magazine articles and consolidated legislation of Finnish legislation.
The quality of the automatic annotation was evaluated by measuring precision and recall against existing manual annotations.
The results showed that the quality of the input text, as well as the selection and configuration of the ontologies impacted the results.
Abstract (fin):Asiasanoja käytetään kuvailemaan dokumentteja ja parantamaan niiden löydettävyyttä.
Asiasanoitusprosessissa asiasanat voidaan valita kontrolloidusta sanastosta.
Näiden sanastojen tai ontologioiden käyttäminen mahdollistaa semanttisten kuvausten ja suhteiden hyödyntämisen.
Tätä kutsutaan myös semanttiseksi annotoinniksi, ja sen avulla voidaan parantaa dokumenttien haettavuutta entisestään.

Tässä työssä kehitettiin sovellus semanttiseen annotointiin osana Sotasampo- ja Semanttinen Finlex -projekteja.
Sovellus linkittää tekstistä löydettyjä tekstuaalisia entiteettejä käyttäjän valitsemiin ontologioihin.
Sovellus on konfiguroitavissa erilaisten suomenkielisten tekstien asiasanoitukseen ja linkitykseen.
Tässä työssä hyödynnettiin Kansa Taisteli -lehden artikkelien ja Semanttisen Finlexin ajantasaisia säädöksiä käyttötapauksina sovellukselle.
Tuloksia arvioitiin vertaamalla niitä alkuperäiseen manuaaliseen annotaatioon käyttäen tarkkuus- ja saantimittauksia.
Tuloksia tutkimalla havaittiin, että syötteen laatu sekä ontologioiden valinta ja konfigurointi vaikuttivat tuloksiin.
ED:2017-01-08
INSSI record number: 55320
+ add basket
« previous | next »
INSSI