search query: @keyword indeksointi / total: 10
reference: 9 / 10
Author: | Mikkonen, Heikki |
Title: | Information Retrieval in the World Wide Web |
Tiedonhaku World Wide Web -ympäristössä | |
Publication type: | Master's thesis |
Publication year: | 1999 |
Pages: | 75 Language: eng |
Department/School: | Tietotekniikan osasto |
Main subject: | Ohjelmistotekniikka (Tik-106) |
Supervisor: | Soisalon-Soininen, Eljas |
Instructor: | Lehtinen, Kari |
OEVS: | Electronic archive copy is available via Aalto Thesis Database.
Instructions Reading digital theses in the closed network of the Aalto University Harald Herlin Learning CentreIn the closed network of Learning Centre you can read digital and digitized theses not available in the open network. The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/ You can read theses on the Learning Centre customer computers, which are available on all floors.
Logging on to the customer computers
Opening a thesis
Reading the thesis
Printing the thesis
|
Location: | P1 Ark T80 | Archive |
Keywords: | information retrieval information brokering information systems search engine indexing WWW Internet WWW Internet informaation haku informaation välitys informaatiojärjestelmät hakukone indeksointi |
Abstract (fin): | Tämä työ keskittyy World Wide Web (WWW) -ympäristössä tapahtuvan tiedonhaun kehittämiseen. Tiedonhakuprosessi jaetaan indeksointi- ja etsimisvaiheeseen. Nämä vaiheet analysoidaan huomioiden WWW:n erityispiirteet verrattuna perinteisiin informaatiojärjestelmiin. Indeksointivaiheessa WWW:n tietoavaruus muutetaan hakukelpoiseksi tietorakenteeksi. WWW:n suuri koko ja erittäin heterogeeninen sisältö vaativat monipuolisen ja tarkan indeksoinnin laadukkaiden hakutulosten saavuttamiseksi. Pelkkä dokumenttien sisällön analysoiminen ei tarjoa riittävästi informaatiota, vaan myös muita lähteitä, kuten linkkirakennetta, tulee käyttää indeksin rakentamiseen. Indeksin laatua voidaan edelleen parantaa lisäämällä dokumentteihin metatietoa, sillä automaattiset analysointimenetelmät eivät pysty purkamaan kaikkea informaatiota ihmisille tarkoitetuista dokumenteista, eikä kaikki tarvittava tieto edes ole löydettävissä dokumenttien sisällöstä. WWW:ssä käytettäväksi soveltuvat metatietojärjestelmät esitellään. Etsintävaiheessa käyttäjän tulisi kyetä ilmaisemaan tiedontarpeensa tiedonhakujärjestelmän kielellä. Käyttäjän tiedontarpeet jaetaan lyhytkestoisiin ja pitkäkestoisiin tarpeisiin. Tätä jakoa vastaavasti tiedonhaun kysely- ja suodatusmallit esitellään. Hakulausekkeen muodostamisen lisäksi informaation esitystekniikat ovat tärkeitä, koska vastausjoukot tulee järjestää käyttäjälle esittämistä varten. Klusterointitekniikat, joilla informaatiota voidaan esittää eri tasoilla, käydään läpi. Työn viimeinen osa käsittelee COBRA-projektia, jonka päämääränä oli kehittää sähköisen välitystoiminnan arkkitehtuurimalli. Käsite tiedonvälitys määritellään, ja sitä verrataan tiedonhakuun. Projektin puitteissa toteutettu tiedonvälitysjärjestelmä esitellään. |
ED: | 1999-07-20 |
INSSI record number: 14624
+ add basket
INSSI