search query: @keyword data mining process / total: 1
reference: 1 / 1
« previous | next »
Author: | Marin, Teppo |
Title: | A data analysis tool set to support the data mining process |
Data-analyysimenetelmät tiedonlouhintaprosessin tukemiseksi | |
Publication type: | Master's thesis |
Publication year: | 2005 |
Pages: | 68 Language: eng |
Department/School: | Tietotekniikan osasto |
Main subject: | Informaatiotekniikka (T-115) |
Supervisor: | Simula, Olli |
Instructor: | Laine, Sampa |
OEVS: | Electronic archive copy is available via Aalto Thesis Database.
Instructions Reading digital theses in the closed network of the Aalto University Harald Herlin Learning CentreIn the closed network of Learning Centre you can read digital and digitized theses not available in the open network. The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/ You can read theses on the Learning Centre customer computers, which are available on all floors.
Logging on to the customer computers
Opening a thesis
Reading the thesis
Printing the thesis
|
Location: | P1 Ark Aalto 8655 | Archive |
Keywords: | data mining data analysis data mining process CRISP-DM tiedonlouhinta data-analyysi tiedonlouhintaprosessi |
Abstract (fin): | Tiedonlouhinta on nopeasti kasvava tieteenala, jolla on vahvat sidokset myös teollisuuteen. Tiedonlouhinnan tavoitteena on löytää suurista data-joukoista uutta hyödyllistä informaatiota. Käsin tutkimalla tämä olisi lähes mahdotonta tietokantojen suuren koon takia. Tiedonlouhinnan tukena käytetään laskennallisia menetelmiä tilastotieteen ja hahmontunnistuksen aloilta. Interaktiivisuus on myös tärkeä osa tiedonlouhintaa, sillä asiantuntijoiden taustatietämys ongelmasta täytyy yhdistää prosessiin, jotta saataisiin hyviä tuloksia. Tässä diplomityössä pyritään kokoamaan joukko data-analyysityökaluja, joiden avulla voidaan tukea tiedonlouhintaprosessin kaikkia vaiheita. Työkalujen täytyy olla helppokäyttöisiä, jotta tavalliset insinöörit voisivat käyttää niitä käytännön ongelmissa. Tutkitut menetelmät toteutetaan Java-ohjelmointikieltä käyttäen. Lisäksi luodaan prosessikaavioita erilaisia tehtäviä varten ohjaamaan etenemistä tiedonlouhintaprojekteissa. Aluksi käydään läpi tiedonlouhintaan liittyviä peruskäsitteitä, ja esitellään erilaisia tekniikoita datan esikäsittelyyn, mallinnukseen sekä visual1ointiin. Tämän jälkeen tiedonlouhintaprosessi käydään läpi CRoss Industry Standard Process for Data Mining (CRISP-DM) mallin avulla. Samalla tutkitaan kuinka esiteltyjä työkaluja voidaan käyttää prosessin tukena. Lopuksi kokeellisessa osuudessa tarkastellaan menetelmien toimivuutta käytännössä. Koko tiedonlouhintaprosessi suoritetaan voimalaitoksesta kerättyä dataa käyttäen. Toteutetut työkalut suoriutuvat hyvin yleisimmistä tiedonlouhintatehtävistä, ja luodut prosessikaaviot auttavat etenemistä tiedonlouhintaprojekteissa. |
ED: | 2005-11-25 |
INSSI record number: 30020
+ add basket
« previous | next »
INSSI