haku: @keyword koneoppiminen / yhteensä: 63
viite: 30 / 63
Tekijä:Airaksinen, Sami
Työn nimi:HIP: Model Combination Algorithm for Location Prediction
HIP: Kombinaatiomallinnus algoritmi paikkaennustukseen
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2014
Sivut:69      Kieli:   eng
Koulu/Laitos/Osasto:Perustieteiden korkeakoulu
Oppiaine:Informaatiotekniikka   (T3006)
Valvoja:Oja, Erkki
Ohjaaja:Aksela, Matti
Elektroninen julkaisu: http://urn.fi/URN:NBN:fi:aalto-201410052745
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto  1737   | Arkisto
Avainsanat:predictive analysis
machine learning
mixture
geolocation
prediktiivinen mallintaminen
koneoppiminen
mikstuurimallit
paikkatieto
Tiivistelmä (fin):Tämän opinnäytetyön tavoitteena oli luoda toimiva konsepti koneoppimisalgoritmista, joka pohjautuu joukkoon regressiomalleja joiden ennustuksen tarkkuutta lähihistoriassa hyödynnettiin ennustuksen parantamiseen.
Analyysi tehtiin paikannustiedolla, jossa oli 87 eri käyttäjän puhelimen liikehistoria pitkältä aikaväliltä.

Kehitetty kehys sisälsi 3 erillistä vaihetta.
Ensimmäisessä vaiheessa tietojoukolle tehtiin 67 piirteenirrotusta siirtyvällä aikaikkuna tekniikalla.
Piirteidenirrotuksessa käytettiin käyräsovitusta ja tiedon statistisien ominaisuuksien määrittelyä.
Toisessa vaiheessa esivalitut regressiomallit koulutettiin piirteitä vasten.
Kolmannessa vaiheessa useita eri kombinaatiostrategioita analysoitiin ja niitä verrattiin yksittäisiin koulutettuihin regressiomalleihin.
Myös syväluotaava analyysi yhdistelmästrategioitten toiminnasta suoritettiin.

Analyysissä selvisi, että kehys paransi ennustuksen osumatarkuutta 32 % suhteessa yksittäiseen parhaaseen regressiomalliin.
Tuloksen tilastollinen merkittävyys vahvistettiin Wilcoxonin menetelmällä.
Täten johtopäätöksenä voidaan todeta, että kyseinen lähestymistapa on parempi kuin mikään käytetyistä yksittäisistä regressiomalleista.
Tiivistelmä (eng):In this thesis a working proof of concept of an algorithm that utilizes multiple regression algorithms and their temporal prediction performance has been developed and analyzed.
This framework was named history predictor (HIP).
Analysis of the algorithm was based on a temporal-spatial data set over 87 persons mobile location behavior.
The overall subject is large to cover and therefore this study concentrated on developing an algorithm with simple 'defaults' on cost of potentially better performance.

The framework consisted of three distinct phases.
First, data was processed to 67 statistical features by using a sliding window technique where each feature was generated over users' location history.
Curve fitting and statistical properties were used to extract features from the source data.
In the second phase pre-selected regression models were trained against the generated features.
Third phase, multiple different selection layer implementations were tried and their performance was analyzed against each other and the base regression models.
Part of the analysis was focused on the best selection layer and its performance with in depth analysis of its internals.

It was found that HIP increased performance over a single predicting model.
When compared to the best performing model, HIP gained relative improvement of 32 % on the hitrate performance compared against the best performing base model.
This was verified with Wilcoxon signed rank test to be statistically significant.
Therefore one can conclude that HIP should be considered a better approach for this data set and topic than using any of the trained regression models independently.
ED:2014-10-05
INSSI tietueen numero: 49805
+ lisää koriin
INSSI