haku: @keyword Semantic Web / yhteensä: 29
viite: 4 / 29
Tekijä:Laitio, Joonas
Työn nimi:Semantic web data quality control
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2011
Sivut:60 s. + liitt.      Kieli:   eng
Koulu/Laitos/Osasto:Mediatekniikan laitos
Oppiaine:Viestintätekniikka   (T-75)
Valvoja:Hyvönen, Eero
Ohjaaja:
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto  5200   | Arkisto
Avainsanat:semantic web
ontologies
data creation
validation
data quality
semanttinen web
ontologiat
datan luonti
validaatio
datan laatu
Tiivistelmä (fin): Datan laatu on kasvava ongelma semanttisessa webissä.
Saatavilla olevan datan määrä kasvaa nopeammin kuin koskaan, ja pääpaino on tähän asti ollut datan luonnissa ja yhdistelyssä sen laadun sijaan.
Nyt huomio on siirtymässä uuden datan luonnista olemassa olevan datan laadun jalostamiseen.

Datan laatu on subjektiivinen käsite, ja sen formaali esittäminen on usein mutkikasta.
Ensiksi täytyy määritellä se, mitä tarkoitetaan datan laadulla, ja mitkä ovat käsitteen eri puolet.
Tämän lisäksi täytyy löytää sopiva tapa laadun esittämiseen.
Lopulta tulee my6s kehittää varsinaisia prosesseja datan jalostamiseen ja laadun parantamiseen, ja tapoja ottaa tämä laatutieto huomioon semanttisessa webissä.

Tämä työ esittää joitain ratkaisuja näihin ongelmiin.
Monia tapoja merkitä laatutietoa on esitetty, hyvine ja huonoine puolineen.
On kehitetty järjestelmä RDF-pohjaisen laatutiedon hallintaan, ja joukko ty6kaluja jotka on räätälöity tämän tiedon hyödyntämiseen.
Lisäksi on kehitetty yleinen automaattisen annotaation rajapinta ja skeemavalidaatiojärjestelmä avoimen maailman oletuksen asettamien rajoitusten puitteissa.
Nämä on toteutettu ja integroitu yleisempään hallintajärjestelmään.
Järjestelmää on testattu käyttäen reaalimaailman käyttötapauksia ja aineistoja ja ensimmäiset tulokset ovat lupaavia.
Tiivistelmä (eng): Data quality is a growing concern on the Semantic Web.
The amount of data available is growing faster than ever, and the emphasis thus far has been on creating and interlinking data without much regard to how good the data actually is.
The trend is shifting from creating new data to refining what already exists.

Data quality is a subjective concept and a formal representation for it is often troublesome.
First, we must define what is meant by data quality -what are the different facets of the concept.
Second, a way for representing this quality must be found.
Third, actual processes to refine data and improve its quality and ways to take data quality into account on the Semantic Web must be developed.

This work presents some solutions to the problem.
Many ways to annotate quality metadata as RDF are first discovered, along with their pros and cons.
A framework for managing RDF-based quality metadata is presented, with a set of tools for specifically managing the quality annotations.

Additionally, an automatic annotation system and a schema validation system, within the restraints of the open world assumption, have been designed, implemented and integrated into the framework.
The system has been tested using real life datasets with promising first results.
ED:2011-10-28
INSSI tietueen numero: 42902
+ lisää koriin
INSSI