haku: @keyword self-organizing map / yhteensä: 55
viite: 8 / 55
Tekijä:Muurinen, Hannes
Työn nimi:Video Segmentation and Shot Boundary Detection Using Self-Organizing Maps
Videoiden segmentointi ja otosrajojen etsintä itseorganisoivien karttojen avulla
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2007
Sivut:92      Kieli:   eng
Koulu/Laitos/Osasto:Automaatio- ja systeemitekniikan osasto
Oppiaine:Informaatiotekniikka   (T-61)
Valvoja:Oja, Erkki
Ohjaaja:Laaksonen, Jorma
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark TKK  6646   | Arkisto
Avainsanat:content-based information retrieval
self-organizing map
shop boundary detection
video processing
sisältöpohjainen informaation haku
itseorganisoiva kartta
otosrajojen etsintä
videon käsittely
Tiivistelmä (fin): Sisältöpohjainen informaation haku (Content-based information retrieval, CBIR) tarjoaa työkaluja datan automaattiseen indeksointiin ja etsintään pelkän sisällön perusteella.
Automaattiset indeksointimenetelmät ovat välttämättömiä, jotta hakukoneilla pystyttäisiin käsittelemään jatkuvasti paisuvia multimedia-aineistomassoja.
Tietokoneiden laskentakapasiteetin nopean kasvun ansiosta CBIR-menetelmiä voidaan nykyään käyttää myös videoiden indeksointiin, mutta pitkät videot on jollakin tavalla pilkottava osiin ennen kuin näitä hakumenetelmiä on mielekästä käyttää.
Tyypillisesti tämä ajallinen segmentointi tehdään pilkkomalla video leikkausrajojen kohdalta otoksen pituisiksi paloiksi.
Otokset ovat yhdellä kamera-ajolla kuvattuja jatkuvia kuvavirtoja, joista videon leikkaaja koostaa suurempia kokonaisuuksia.
Niitä voidaan siten pitää videoiden alkeisosina, joita on luonnollista käyttää hauissa.

Työn tarkoituksena oli kehittää otosrajojen tunnistin PicSOM-nimiseen CBIR-järjestelmään.
Tunnistusmenetelmä etsii rajoja seuraamalla rinnakkaisten itse organisoivien karttojen (Self-Organizing Map, SOM) trajektoreja ja yrittämällä havaita näiden perusteella epäjatkuvuuskohdat videon kuvavirrasta.
SOM-kuvaus kompensoi sitä, että jotkut piirreavaruuksien osat ovat todennäköisempiä kuin toiset, joten kartta siirtymien voidaan olettaa olevan piirrevektorien välisiä etäisyyksiä merkityksellisempiä.
Kahden karttakoordinaatin välisen etäisyyden sijaan tunnistimessa vertaillaan useamman trajektoripisteen muodostaman ikkunan etäisyyttä toiseen ikkunaan, mikä lisää järjestelmän virheensietokykyä.

Kirjallisuustutkimusosassa esitetään perusteet videon segmentoinnista ja otosrajojen etsinnästä.
Lisäksi työn tässä osassa esitellään käytetyimmät otosrajojen tunnistusmenetelmät ja kerrotaan, miten tunnistimissa on tyypillisesti ratkaistu joitakin otosrajojen etsinnässä usein kohdattuja vaikeuksia.

Työosuudessa kuvaillaan, kuinka PicSOM-järjestelmään lisättiin videotiedostojen käsittelijä ja otosrajojen etsijä.
Lisäksi kerrotaan empiirisistä kokeista, joilla järjestelmän suorituskykyä tutkittiin.
Järjestelmän kokonaistehokkuuden lisäksi kokeissa havainnoitiin sitä, miten trajektori-ikkunoiden ja eri piirteiden käyttö etäisyysmittauksissa vaikutti järjestelmän toimintaan.
ED:2007-02-09
INSSI tietueen numero: 33072
+ lisää koriin
INSSI