search query: @keyword nonlinear dimensionality reduction / total: 1
reference: 1 / 1
« previous | next »
Author: | Sandholm, Max |
Title: | Information Retrieval Perspective to Interactive Data Visualization |
Tiedonhakuperspektiivi interaktiiviseen visualisointiin | |
Publication type: | Master's thesis |
Publication year: | 2013 |
Pages: | iv + 46 Language: eng |
Department/School: | Perustieteiden korkeakoulu |
Main subject: | Informaatiotekniikka (T-61) |
Supervisor: | Kaski, Samuel |
Instructor: | Peltonen, Jaakko |
OEVS: | Electronic archive copy is available via Aalto Thesis Database.
Instructions Reading digital theses in the closed network of the Aalto University Harald Herlin Learning CentreIn the closed network of Learning Centre you can read digital and digitized theses not available in the open network. The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/ You can read theses on the Learning Centre customer computers, which are available on all floors.
Logging on to the customer computers
Opening a thesis
Reading the thesis
Printing the thesis
|
Location: | P1 Ark Aalto 30 | Archive |
Keywords: | distance metric learning information retrieval interactive visualization nonlinear dimensionality reduction epälineaarinen dimensionpudotus etäisyysmetriikan oppiminen interaktiivinen visualisointi tiedonhaku |
Abstract (eng): | Exploration of data is an essential step in forming preliminary hypotheses, and perhaps getting some idea of what to focus on next. However, it is often too time-consuming for users to go through data tables, not to mention that finding structure in a matrix of numbers by eye can be very difficult. Thus visualizations such as scatter plots must be used to make exploration and drawing conclusions easier for a user. Visualization has recently been formulated as an information retrieval task, where the goal of the user is to retrieve neighborhood relationships from the display. The algorithm for optimizing the display coordinates for the specific retrieval task is called the neighbor retrieval visualizer (NeRV). The neighborhood relationships, which the algorithm tries to preserve in the visualization, are defined by a metric in the input space. The metric essentially encodes what aspects are relevant in the data. When the metric is not known a priori, it has to come from the user. In an exploratory setting we cannot expect the user to know the correct metric beforehand, but instead we should learn an appropriate metric for the specific user interactively. In this thesis an interactive visualization method is presented, which can be seen as a direct interactive extension to NeRV. Interactive visualization is formulated as information retrieval under uncertainty of the user preferences. The entire interactive system is planned to support a user in retrieving the neighborhood relationships, which correspond to the user's preferences, from the display. The method works as follows. It iteratively produces a visualization, allows the user to give simple pairwise feedback based on missed neighbors or false neighbors on the display, learns a better metric based on the feedback, and continues until the user is satisfied with the visualization. In the experiments it is shown that using a visualization to select feedback pair benefits metric learning, and improving the metric allows us to produce better visualizations. The method is also evaluated in a small-scale user study. As a conclusion, the system showed potential in limited test scenarios, but further development is needed for extensive practical use. |
Abstract (fin): | Datan eksplorointi on olennainen askel ensimmäisten hypoteesien muodostuksessa ja tulevien kiinnostuksenkohteiden paljastuksessa. Datataulukoiden läpikäynti on kuitenkin usein liian aikaa vievää ja rakenteen löytäminen numeerisesta matriisista voi olla hyvin hankalaa. Siispä visualisaatioita kuten pisteparvia on käytettävä, jotta eksplorointi ja johtopäätösten vetäminen olisi helpompaa käyttäjälle. Visualisointi on hiljattain formuloitu tiedonhakutehtävänä, jossa käyttäjän tavoite on hakea naapuruussuhteita ruudulta. Formulaatiota vastaava algoritmi, "neighbor retrieval visualizer" (NeRV), yrittää optimoida visualisaation suoraan haluttua tiedonhakutehtävää varten. Naapuruussuhteet, joita algoritmi yrittää säilyttää visualisaatiossa, määritellään dataavaruudessa etäisyysmetriikan avulla. Metriikka on tapa esittää, mitkä osat datasta ovat relevantteja käyttäjälle. Kun metriikkaa ei tiedetä etukäteen, sen on tultava käyttäjältä. Eksploratiivisessa tilanteessa käyttäjän on kuitenkin hankala suoraan antaa oikeaa metriikkaa, ja meidän tulisi oppia se käyttäjältä yksinkertaisten interaktiomahdollisuuksien kautta. Tässä diplomityössä esitetään ratkaisu interaktiiviseen visualisointiin, mikä on nähtävissä suorana interaktiivisena laajennuksena NeRV-algoritmille. Interaktiivinen visualisointi formuloidaan tiedonhakutehtävänä, jossa on epävarmuutta käyttäjän preferensseistä. Koko interaktiivisen systeemin tarkoitus on palvella käyttäjää hänelle sopivien naapuruussuhteiden löytämisessä visualisaatiosta. Jokaisessa iteraatiossa tuotetaan visualisaatio, annetaan käyttäjän antaa yksinkertaista pareittaista palautetta väärien naapuruussuhteiden perusteella, ja opitaan käyttäjälle sopivampi metriikka palautteen perusteella. Iterointia jatketaan, kunnes käyttäjä on tyytyväinen visualisaatioon. Kokeellisessa osuudessa näytetään, että visualisaation käyttäminen palautteen antamiseen hyödyttää metriikan oppimista, ja metriikan parantaminen myös mahdollistaa parempien visualisaatioiden tuottamisen. Metodia arvioidaan myös pienen käyttäjäkokeen avulla. Diplomityössä esitetty systeemi interaktiiviselle visualisoinnille osoitti potentiaalia yksinkertaisissa testiasetelmissa, mutta lisäkehitystä tarvitaan laajempaa käyttöä varten. |
ED: | 2013-03-26 |
INSSI record number: 46016
+ add basket
« previous | next »
INSSI