haku: @keyword text mining / yhteensä: 3
viite: 3 / 3
« edellinen | seuraava »
Tekijä:Paatero, Vesa
Työn nimi:Sanojen painotusmenetelmien vertailu WEBSOM-kartoilla
A comparison of term weighting methods using WEBSOM maps
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2003
Sivut:62      Kieli:   fin
Koulu/Laitos/Osasto:Teknillisen fysiikan ja matematiikan osasto
Oppiaine:Informaatiotekniikka   (Tik-61)
Valvoja:Kaski, Samuel
Ohjaaja:Lagus, Krista
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto  5312   | Arkisto
Avainsanat:WEBSOM
self-organizing map (SOM)
information retrieval
term weighting
text mining
itseorganisoiva kartta
tiedonhaku
sanojen painotus
tekstin louhinta
Tiivistelmä (fin): WEBSOM on menetelmä, jolla voidaan kuvata tekstidokumenttiaineisto karttapinnalle siten, että samaan aihepiiriin kuuluvat dokumentit kuvautuvat lähelle toisiaan karttapinnalla.
Jotta dokumenttikartta järjestyisi mahdollisimman mielekkäästi, dokumentissa esiintyviä sanoja painotetaan eri tavoin.
Tarkoituksena on, että dokumentin aihepiirin määräytymisen kannalta tärkeät sanat vaikuttaisivat WEBSOM-kartan opettamiseen suuremmalla painoarvolla kuin hyvin yleiset tai muuten epäoleelliset sanat.
Painotus voidaan jakaa kahteen erilliseen osaan: globaaliin painotukseen ja dokumenttikohtaiseen, lokaaliin painotukseen.

Tässä työssä on vertailtu WEBSOM-karttojen kanssa käytettäviä painotusmenetelmiä kokeellisesti.
Kokeissa oli mukana neljä globaalin painotuksen menetelmää ja neljä dokumenttikohtaisen painotuksen menetelmää, yhteensä 16 menetelmäyhdistelmää.
Painotusmenetelmien vertailu toteutettiin laatimalla monta WEBSOM-karttaa kutakin menetelmäyhdistelmää käyttäen ja vertailemalla karttojen paremmuutta.
Karttojen vertailua varten kehitettiin mitta karttojen hyvyydelle.
Mitta soveltuu sellaisten tekstiaineistojen kanssa käytettäväksi, joissa artikkelien välillä on assosiaatiota ilmaisevia linkkejä, kuten esim.
WWW-sivuilla tai tietosanakirjoissa.

Työn toisena tavoitteena oli laatia WEBSOM-demonstraatio toisiinsa linkitettyjä dokumentteja sisältäviä sisältävästä aineistosta.
Demonstraatio toteutettiin käyttäen Encyclopaedia Britannica -tietosanakirjan WWW-version tekstiaineistoa Vertailututkimuksen tuloksena tietyt painotusmenetelmät havaittiin suositeltaviksi.
Kävi myös ilmi, että globaalin painotusmenetelmän valinta vaikuttaa kartan järjestymiseen yleisesti ottaen enemmän kuin dokumenttikohtaisen painotusmenetelmän valinta.
Tiivistelmä (eng): The WEBSOM is a method for organizing text documents onto a map surface so that documents treating similar topics are situated near each other on the map surface.
To improve the organization process, the words in the documents are weighed using various methods so that those words that play an important role in determining the topics of documents get greater weights than very frequent or otherwise irrelevant words.
Term weighting can be divided into two distinct phases: Global term weighting and local term weighting.
Local weighting takes place in each document separately.

In this work, term weighting methods used with WEBSOM maps have been evaluated empirically.
The comparison study includes 4 methods for global term weighting and 4 methods for local term weighting, which can be used in 16 combinations.
For the purposes of the comparison study, a measure for the goodness of a WEBSOM map was developed and implemented.
The measure can be used with document collections comprising interlinked documents, such as collections of WWW pages or encyclopaedias.

Another goal of this work was to create a WEBSOM demonstration of a text collection with associative links.
The WEBSOM map was created using the text material of the WWW version of Encyclopaedia Britannica.

Based on the results of the comparison study, certain term weighting methods can be recommended.
The study also suggests that the choice of the global term weighting method affects the resulting WEBSOM map more than the local term weighting method.
ED:2004-01-08
INSSI tietueen numero: 21083
+ lisää koriin
« edellinen | seuraava »
INSSI