haku: @keyword massadata / yhteensä: 3
viite: 3 / 3
« edellinen | seuraava »
Tekijä:Honkanen, Rami
Työn nimi:Genomic data staging for parallel analysis
Genomisen tiedon välivarastointi rinnakkaista käsittelyä varten
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2014
Sivut:86      Kieli:   eng
Koulu/Laitos/Osasto:Perustieteiden korkeakoulu
Oppiaine:Ohjelmistotekniikka   (T3001)
Valvoja:Heljanko, Keijo
Ohjaaja:Sevon, Petteri
Elektroninen julkaisu: http://urn.fi/URN:NBN:fi:aalto-201406252191
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto  1725   | Arkisto
Avainsanat:distributed storage
distributed analysis
data staging
genomics
big data
hajautettu tallennus
tiedon välivarastointi
genomiikka
massadata
Tiivistelmä (fin):Tämä diplomityö esittelee ratkaisun suurten genomisten tietomäärien skaalautuvaan, luotettavaan ja turvalliseen tallentamiseen.
Suunniteltavan järjestelmän on tarkoitus korvata Biocomputing Platforms Oy:n tuotteissa käytössä oleva tallennusjärjestelmä, mikä asettaa työlle useita vaatimuksia.

Suurin tarve uudelle ratkaisulle aiheutuu genotyypityslaitteiden tuottaman tietomäärän kasvusta sekä yleistyvästä käytännöstä yhdistellä suuria eri lähteistä saatuja aineistoja.
Skaalautuvuuden lisäksi myös tietoturvallisuusvaatimukset ovat tiukentumassa.

Työssä suunniteltiin uusi hajautettu tiedontallennusjärjestelmä, joka tarjoaa nopean ja sijaintiriippumattoman pääsyn monenlaisiin tiedonvarastoinnin taustajärjestelmiin, mukaanlukien joihinkin suosittuihin pilvitallennuspalveluihin.

Ratkaisu skaalautuu satoihin teratavuihin perinteisellä laitteistolla ja huomattavasti suurempaan tietomäärään joihinkin ulkoisiin tallennusjärjestelmiin yhdistettynä.
Lopuksi esitellään tapoja parantaa suunnitelmaa petatavujen kokoisen tiedon tallentamiseen ilman ulkoisia järjestelmiä.
Tiivistelmä (eng):This Master's Thesis describes a solution for storing large genomic data in a scalable, robust and secure way.
There are various constraints for the design, because the new solution is intended to replace an existing storage system that is already in production use by Biocomputing Platforms Ltd.

The primary demand for this solution arises from the growing size of data produced by genotyping devices and processes, and the growing practice of combining large genomic data sets for analysis.
In addition to scalability, security requirements and expectations are also tightening.

A new distributed storage system was designed to provide fast and location-transparent access to various storage back-ends, including some popular cloud storage services.

The solution scales up to hundreds of terabytes with conventional hardware, and much further when used in conjunction with other scalable storage systems.
Finally, other ways are presented for improving the design to reach petascale with conventional or virtualised hardware.
ED:2014-08-03
INSSI tietueen numero: 49408
+ lisää koriin
« edellinen | seuraava »
INSSI