search query: @keyword luonnollisen kielen käsittely / total: 5
reference: 4 / 5
Author: | Vesalainen, Heikki |
Title: | Automatic Extraction of Protein-Protein Interactions from Medical Papers |
Proteinien välisten vuorovaikutusten automaattinen eristäminen lääketieteellisistä julkaisuista | |
Publication type: | Master's thesis |
Publication year: | 2005 |
Pages: | (8) + 64 Language: eng |
Department/School: | Tietotekniikan osasto |
Main subject: | Informaatiotekniikka (T-115) |
Supervisor: | Simula, Olli |
Instructor: | Arppe, Antti |
OEVS: | Electronic archive copy is available via Aalto Thesis Database.
Instructions Reading digital theses in the closed network of the Aalto University Harald Herlin Learning CentreIn the closed network of Learning Centre you can read digital and digitized theses not available in the open network. The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/ You can read theses on the Learning Centre customer computers, which are available on all floors.
Logging on to the customer computers
Opening a thesis
Reading the thesis
Printing the thesis
|
Location: | P1 Ark Aalto 8727 | Archive |
Keywords: | information extraction IE natural language processing NLP bioinformatics tiedon eristäminen luonnollisen kielen käsittely bioinformatiikka |
Abstract (fin): | Tämä diplomityö esittelee tiedoneristämisjärjestelmän, jonka tarkoituksena on eristää etenkin proteinien välisistä vuorovaikutuksista kertovaa tietoa biolääketieteellisistä teksteistä. Järjestelmä käyttää tekstin analysointiin kaupallisesti saatavilla olevaa, yleiskäyttöistä luonnollisen kielen jäsennintä, sekä kahden tyyppisiä sääntöjä: linkkisääntöjä ja säännöllisiä lausekkeita. Edellisistä linkkisäännöt tarkastelevat jäsentimen tuottamia, sanojen suhteista (kuten adjektiivi, subjekti tai objekti) kertovia syntaktisia riippuvuuksia. Järjestelmää testataan joukolla annotoituja lauseita ja järjestelmän hahmontunnistusmodulin tehokkuutta mitataan. Kokeen järjestely, tulokset ja analyysi kuvataan luvussa 6. Numeeriset tulokset ovat seuraavat: saanti 51%, tarkkuus 100% ja f-score 68%. |
ED: | 2005-06-09 |
INSSI record number: 28844
+ add basket
INSSI