haku: @author Sandholm, Max / yhteensä: 2
viite: 1 / 2
« edellinen | seuraava »
Tekijä: | Sandholm, Max |
Työn nimi: | Information Retrieval Perspective to Interactive Data Visualization |
Tiedonhakuperspektiivi interaktiiviseen visualisointiin | |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 2013 |
Sivut: | iv + 46 Kieli: eng |
Koulu/Laitos/Osasto: | Perustieteiden korkeakoulu |
Oppiaine: | Informaatiotekniikka (T-61) |
Valvoja: | Kaski, Samuel |
Ohjaaja: | Peltonen, Jaakko |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark Aalto 30 | Arkisto |
Avainsanat: | distance metric learning information retrieval interactive visualization nonlinear dimensionality reduction epälineaarinen dimensionpudotus etäisyysmetriikan oppiminen interaktiivinen visualisointi tiedonhaku |
Tiivistelmä (fin): | Datan eksplorointi on olennainen askel ensimmäisten hypoteesien muodostuksessa ja tulevien kiinnostuksenkohteiden paljastuksessa. Datataulukoiden läpikäynti on kuitenkin usein liian aikaa vievää ja rakenteen löytäminen numeerisesta matriisista voi olla hyvin hankalaa. Siispä visualisaatioita kuten pisteparvia on käytettävä, jotta eksplorointi ja johtopäätösten vetäminen olisi helpompaa käyttäjälle. Visualisointi on hiljattain formuloitu tiedonhakutehtävänä, jossa käyttäjän tavoite on hakea naapuruussuhteita ruudulta. Formulaatiota vastaava algoritmi, "neighbor retrieval visualizer" (NeRV), yrittää optimoida visualisaation suoraan haluttua tiedonhakutehtävää varten. Naapuruussuhteet, joita algoritmi yrittää säilyttää visualisaatiossa, määritellään dataavaruudessa etäisyysmetriikan avulla. Metriikka on tapa esittää, mitkä osat datasta ovat relevantteja käyttäjälle. Kun metriikkaa ei tiedetä etukäteen, sen on tultava käyttäjältä. Eksploratiivisessa tilanteessa käyttäjän on kuitenkin hankala suoraan antaa oikeaa metriikkaa, ja meidän tulisi oppia se käyttäjältä yksinkertaisten interaktiomahdollisuuksien kautta. Tässä diplomityössä esitetään ratkaisu interaktiiviseen visualisointiin, mikä on nähtävissä suorana interaktiivisena laajennuksena NeRV-algoritmille. Interaktiivinen visualisointi formuloidaan tiedonhakutehtävänä, jossa on epävarmuutta käyttäjän preferensseistä. Koko interaktiivisen systeemin tarkoitus on palvella käyttäjää hänelle sopivien naapuruussuhteiden löytämisessä visualisaatiosta. Jokaisessa iteraatiossa tuotetaan visualisaatio, annetaan käyttäjän antaa yksinkertaista pareittaista palautetta väärien naapuruussuhteiden perusteella, ja opitaan käyttäjälle sopivampi metriikka palautteen perusteella. Iterointia jatketaan, kunnes käyttäjä on tyytyväinen visualisaatioon. Kokeellisessa osuudessa näytetään, että visualisaation käyttäminen palautteen antamiseen hyödyttää metriikan oppimista, ja metriikan parantaminen myös mahdollistaa parempien visualisaatioiden tuottamisen. Metodia arvioidaan myös pienen käyttäjäkokeen avulla. Diplomityössä esitetty systeemi interaktiiviselle visualisoinnille osoitti potentiaalia yksinkertaisissa testiasetelmissa, mutta lisäkehitystä tarvitaan laajempaa käyttöä varten. |
Tiivistelmä (eng): | Exploration of data is an essential step in forming preliminary hypotheses, and perhaps getting some idea of what to focus on next. However, it is often too time-consuming for users to go through data tables, not to mention that finding structure in a matrix of numbers by eye can be very difficult. Thus visualizations such as scatter plots must be used to make exploration and drawing conclusions easier for a user. Visualization has recently been formulated as an information retrieval task, where the goal of the user is to retrieve neighborhood relationships from the display. The algorithm for optimizing the display coordinates for the specific retrieval task is called the neighbor retrieval visualizer (NeRV). The neighborhood relationships, which the algorithm tries to preserve in the visualization, are defined by a metric in the input space. The metric essentially encodes what aspects are relevant in the data. When the metric is not known a priori, it has to come from the user. In an exploratory setting we cannot expect the user to know the correct metric beforehand, but instead we should learn an appropriate metric for the specific user interactively. In this thesis an interactive visualization method is presented, which can be seen as a direct interactive extension to NeRV. Interactive visualization is formulated as information retrieval under uncertainty of the user preferences. The entire interactive system is planned to support a user in retrieving the neighborhood relationships, which correspond to the user's preferences, from the display. The method works as follows. It iteratively produces a visualization, allows the user to give simple pairwise feedback based on missed neighbors or false neighbors on the display, learns a better metric based on the feedback, and continues until the user is satisfied with the visualization. In the experiments it is shown that using a visualization to select feedback pair benefits metric learning, and improving the metric allows us to produce better visualizations. The method is also evaluated in a small-scale user study. As a conclusion, the system showed potential in limited test scenarios, but further development is needed for extensive practical use. |
ED: | 2013-03-26 |
INSSI tietueen numero: 46016
+ lisää koriin
« edellinen | seuraava »
INSSI