haku: @keyword data-analyysi / yhteensä: 21
viite: 8 / 21
Tekijä:Virtanen, Markus M.
Työn nimi:Predictive analytics for improved problem management
Ongelmanhallinnan parantaminen ennustavalla analytiikalla
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2014
Sivut:48 s. + liitt. 2 s.      Kieli:   eng
Koulu/Laitos/Osasto:Perustieteiden korkeakoulu
Oppiaine:Ohjelmistotekniikka   (T-220)
Valvoja:Heljanko, Keijo
Ohjaaja:Manninen, Esa
Elektroninen julkaisu: http://urn.fi/URN:NBN:fi:aalto-201405131812
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto     | Arkisto
Avainsanat:data analysis
predictive analytics
geostatistics
big data
machine learning
random forest
Hadoop
Hive
R
data-analyysi
ennakoiva analytiikka
geostatistiikka
big data
koneoppiminen
random forest
Hadoop
Hive
R
Tiivistelmä (fin):Tämä diplomityö tutkii mahdollisia data-analyysimenetelmiä parantaakseen Elisan vianhallintapalvelua.
Ensisijainen tarkoitus on löytää ja evaluoida sopivia menetelmiä, jotka antavat ymmärrystä vikoihin, ja luoda ennustemalleja hypoteesien ja datan perusteella, joilla ongelmat saataisiin estettyä tai minimoitua ennen kuin asiakkaan tarvitsee ottaa yhteyttä asiakaspalveluun.
Apachen Hadoop ohjelmisto ja R-ohjelmointikieli integroitiin tehden lineaarisesti skaalautuva analyysiprosessi mahdolliseksi.
Asiakkaan data haettiin ensin tutkimustietokoneelle, jotta analyyttiset haut eivät kuormita tuotantotietokantoja.
Analyysivaihe on jaettu kahteen osaan, jotka molemmat auttavat dataan perustuvaa päätöksentekoa.
Ensin tutkivia analyysimenetelmiä käytetään löytämään arvokasta informaatiota historiallisesta datasta hyödyntäen tekstipohjaisia yhteenvetoja ja visuaalisia menetelmiä.
Seuraavaksi, kun data on siivottua ja siitä on hyvä käsitys, prediktiivistä analyytiikkaa käytetään luomaan ennusteita tulevasta.
Kaikista tarkastelluista koneoppimismalleista Random Forest algoritmilla oli paras suorituskyky annettuun ennustetehtävään.
Lopullinen optimoitu malli ennusti oikein 77 % kaikista ongelmatiketeistä vähentäen tarvetta lähettää korjaaja kentälle asiakkaan Internet-yhteyden toimiessa hyvin.
Tiivistelmä (eng):This Thesis studies the possible data analysis methods to improve the problem management service at Elisa corporation.
The primary objective is to find and evaluate appropriate data analysis methods to understand the underlying problem causes and to develop predictive models from hypotheses and data, so that the problems could be prevented or minimized before the customer feels she or he has to contact the customer service.
Apache Hadoop framework and R programming language have been integrated to make a linearly scalable analytics process possible.
Customer data is first imported to research computer so that there is no need to execute analytical queries on the production databases.
The analytics phase is divided into two parts both helping with data-based decision making.
At first, exploratory data analysis is used to find valuable information from the historical data with the help of textual data summaries and visualizations.
After that, when there is cleaned data and a good understanding has been obtained of its behaviour, predictive analytics is included to make forecasts about the future behaviour.
Out of all the evaluated machine learning algorithms for the given task, the Random Forest algorithm had the best performance.
The final tuned model predicted the right outcome for approximately 77 % of problem tickets minimizing the need to send a repair technician if a customer's Internet connection works well.
ED:2014-05-18
INSSI tietueen numero: 49044
+ lisää koriin
INSSI