search query: @instructor Härmä, Aki / total: 7
reference: 3 / 7
Author: | Pham, Kien |
Title: | Conversation detection in ambient telephone |
Publication type: | Master's thesis |
Publication year: | 2009 |
Pages: | ix + 55 Language: eng |
Department/School: | Signaalinkäsittelyn ja akustiikan laitos |
Main subject: | Signaalinkäsittelytekniikka (S-88) |
Supervisor: | Skyttä, Jorma |
Instructor: | Härmä, Aki |
OEVS: | Electronic archive copy is available via Aalto Thesis Database.
Instructions Reading digital theses in the closed network of the Aalto University Harald Herlin Learning CentreIn the closed network of Learning Centre you can read digital and digitized theses not available in the open network. The Learning Centre contact details and opening hours: https://learningcentre.aalto.fi/en/harald-herlin-learning-centre/ You can read theses on the Learning Centre customer computers, which are available on all floors.
Logging on to the customer computers
Opening a thesis
Reading the thesis
Printing the thesis
|
Location: | P1 Ark S80 | Archive |
Keywords: | ambient telephone conversation detection speech signal processing hajautettu audiokommunikaatiojärjestelmä keskustelun mallinnus puheenkäsittely |
Abstract (fin): | Nykyisessä hajautetussa audiokommunikaatiojärjestelmässä on tarpeellista olla erillinen moduuli, joka kykenee separoimaan kahdenvälistä aktiivista keskustelua muista äänilähteistä. Tämän diplomityön päämääränä on kehittää laskennallinen malli, joka pystyy tunnistamaan keskustelua äänisignaalista mahdollistaakseen luotettavan äänen paikantumisen järjestelmässä. Esivaiheena keskustelumallinnuksessa on pyrkiä havaitsemaan milloin kukin henkilöistä puhuu ja kuinka kauan he puhuvat. Tähän tarkoitukseen sovellettiin menetelmää, joka osaa erottaa puhesegmentit muista taustamelusta äänisignaalissa. Kyseisiä menetelmiä esitellään ja läpikäydään kirjallisuuskatsauksessa. Keskustelumallinnuksen ongelmana ovat samanaikaisesti tapahtuvat puheaktiviteetit. Nykyisissä keskustelumalleissa tämä ilmiö vaikuttaa alentavasti niiden suorituskykyyn. Tähän tarkoitukseen kehitettiin uudenlainen malli, joka poistaa kyseiset päällekkäiset puheaktiviteetit perustuen kuuntelijan tuottamiin leksikaalisiin vastauksiin. Sen lisäksi mallin luotettavuutta kohennettiin analysoimalla päällekkäisten puheaktiviteettien hienorakennetta. Mallia testattiin laajalla puhemateriaalilla, joka oli nauhoitettu oikeista keskusteluista. Mallia myös verrattiin tähän hetkisiin menetelmiin ja tulokset osoittivat, että sillä on suuri potentiaali keskustelun havaitsemisessa tuottaen yli 90 prosentin tarkkuuden yhden minuutin tarkasteluajalla. |
ED: | 2009-04-16 |
INSSI record number: 37310
+ add basket
INSSI