haku: @keyword koneoppiminen / yhteensä: 63
viite: 30 / 63
Tekijä: | Airaksinen, Sami |
Työn nimi: | HIP: Model Combination Algorithm for Location Prediction |
HIP: Kombinaatiomallinnus algoritmi paikkaennustukseen | |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 2014 |
Sivut: | 69 Kieli: eng |
Koulu/Laitos/Osasto: | Perustieteiden korkeakoulu |
Oppiaine: | Informaatiotekniikka (T3006) |
Valvoja: | Oja, Erkki |
Ohjaaja: | Aksela, Matti |
Elektroninen julkaisu: | http://urn.fi/URN:NBN:fi:aalto-201410052745 |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark Aalto 1737 | Arkisto |
Avainsanat: | predictive analysis machine learning mixture geolocation prediktiivinen mallintaminen koneoppiminen mikstuurimallit paikkatieto |
Tiivistelmä (fin): | Tämän opinnäytetyön tavoitteena oli luoda toimiva konsepti koneoppimisalgoritmista, joka pohjautuu joukkoon regressiomalleja joiden ennustuksen tarkkuutta lähihistoriassa hyödynnettiin ennustuksen parantamiseen. Analyysi tehtiin paikannustiedolla, jossa oli 87 eri käyttäjän puhelimen liikehistoria pitkältä aikaväliltä. Kehitetty kehys sisälsi 3 erillistä vaihetta. Ensimmäisessä vaiheessa tietojoukolle tehtiin 67 piirteenirrotusta siirtyvällä aikaikkuna tekniikalla. Piirteidenirrotuksessa käytettiin käyräsovitusta ja tiedon statistisien ominaisuuksien määrittelyä. Toisessa vaiheessa esivalitut regressiomallit koulutettiin piirteitä vasten. Kolmannessa vaiheessa useita eri kombinaatiostrategioita analysoitiin ja niitä verrattiin yksittäisiin koulutettuihin regressiomalleihin. Myös syväluotaava analyysi yhdistelmästrategioitten toiminnasta suoritettiin. Analyysissä selvisi, että kehys paransi ennustuksen osumatarkuutta 32 % suhteessa yksittäiseen parhaaseen regressiomalliin. Tuloksen tilastollinen merkittävyys vahvistettiin Wilcoxonin menetelmällä. Täten johtopäätöksenä voidaan todeta, että kyseinen lähestymistapa on parempi kuin mikään käytetyistä yksittäisistä regressiomalleista. |
Tiivistelmä (eng): | In this thesis a working proof of concept of an algorithm that utilizes multiple regression algorithms and their temporal prediction performance has been developed and analyzed. This framework was named history predictor (HIP). Analysis of the algorithm was based on a temporal-spatial data set over 87 persons mobile location behavior. The overall subject is large to cover and therefore this study concentrated on developing an algorithm with simple 'defaults' on cost of potentially better performance. The framework consisted of three distinct phases. First, data was processed to 67 statistical features by using a sliding window technique where each feature was generated over users' location history. Curve fitting and statistical properties were used to extract features from the source data. In the second phase pre-selected regression models were trained against the generated features. Third phase, multiple different selection layer implementations were tried and their performance was analyzed against each other and the base regression models. Part of the analysis was focused on the best selection layer and its performance with in depth analysis of its internals. It was found that HIP increased performance over a single predicting model. When compared to the best performing model, HIP gained relative improvement of 32 % on the hitrate performance compared against the best performing base model. This was verified with Wilcoxon signed rank test to be statistically significant. Therefore one can conclude that HIP should be considered a better approach for this data set and topic than using any of the trained regression models independently. |
ED: | 2014-10-05 |
INSSI tietueen numero: 49805
+ lisää koriin
INSSI