haku: @keyword tietokanta / yhteensä: 77
viite: 3 / 77
Tekijä:Soinio, Juuso
Työn nimi:Edistynyt tekstinhaku relaatiotietokannasta
Advanced text-searching in relational database
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2015
Sivut:65 + 1      Kieli:   fin
Koulu/Laitos/Osasto:Perustieteiden korkeakoulu
Oppiaine:Ohjelmistotekniikka   (T-106)
Valvoja:Malmi, Lauri
Ohjaaja:Halme, Mervi ; Costiander, Janne
Elektroninen julkaisu: http://urn.fi/URN:NBN:fi:aalto-201512165616
Sijainti:P1 Ark Aalto  3288   | Arkisto
Avainsanat:information retrieval
text searching
full-text search
postgresqi
vapaatekstihaku
lucene
relaatiotietokanta
tietokanta
avoin lähdekoodi
Tiivistelmä (fin):Tässä työssä tutkitaan tekstihakuun tarkoitettuja tekniikoita ja avoimen lähdekoodin ohjelmistoja.
Työssä kartoitetaan tekstihaun ratkaisujen nykytilaa tieteellisessä kirjallisuudessa.
Tekstihaun tekniikoista tutkitaan suoraviivaisia menetelmiä ja erityisesti erilaisia indeksointimenetelmiä.
Toisaalta työssä myöskin etsitääˆn erilaisa käytänˆnöˆn ratkaisuja avoimen lähdekoodin ohjelmistoista.
Työn pääˆtavoitteena on tutkia miten relaatiotietokannassa olevaan tekstidataan pääˆtään tekemääˆn edistyneempiä tekstihakuja.

Diplomityö jakautuu kahteen pääˆosaan: Kirjallisuuskatsaukseen ja käytännön osioon.
Kirjallisuuskatsauksessa tarkasteltiin tekstihaun menetelmiä tieteellisissä julkaisuissa ja pyritääˆn kuvaamaan tutkimuksen nykytilaa Käytänˆnöˆn osiossa kartoitettiin olemassa olevia ohjelmistoratkaisuja tekstihakuun.
Käytännön osiossa pyrittiin etsimääˆn sopivaa ratkaisua relaatiotietokannassa olevan tekstin indeksointiin ja edistyneeseen tekstihakuun.

Työssä saatiin luotua sopiva yleiskatsaus tekstihaun menetelmiin ja löydettiin kymmeniä avoimen lähdekoodin ratkaisuja vapatekstihakuun.
Avoimen lähdekoodin ohjelmistosta saatiin haarukoitua kolme toimintaperiaatteeltaan eroavaa järjestelmääˆ käytännön testaukseen.
Järjestelmien suorituskyvystä ja ominaisuuksista löydettiin testauksessa eroja ja testauksen perusteella pystyttiin esittämääˆn suosituksetjärjestelmien soveltuvuudesta erilaisiin käyttötapauksiin.
Tiivistelmä (eng):This work reviews string searching techniques and open source software for full text searching.
The work surveys the current state of text search solutions in scientific litera- ture.
In text search techniques the work examines online methods and especially different types of indexing methods.
On the other hand in this paper we also look for different open source solutions for full text search.
One of the main goals is to find out how to do advanced text searching on a data found in relational database.

This thesis consists of two main parts: The literature review part and practical part.
In literature review we examined the text search methods present in scientific literature and try to describe the current state of the research.
In the practical part, existing open source solutions for text search are reviewed.
The practical part aims to to find a suitable solution for indexing text data saved in relational database for executing advanced full-text searches.

Sufficient overall view for string searching methods and full text search was reached and dozens of open source solutions for full text search were found.
Three different systems from the open source search solutions were chosen for practical testing part.
Differences in performance and features were found as a result of the testing.
Based on the tests, recommendations for the suitability of these systems to different use cases were represented.
ED:2016-01-17
INSSI tietueen numero: 52741
+ lisää koriin
INSSI