haku: @supervisor Alku, Paavo / yhteensä: 39
viite: 25 / 39
Tekijä: | Virtanen, Harri Antero |
Työn nimi: | Analysis of voice activity detection and discontinuous transmission methods in 3G MGW |
Puheaktiivisuuden tunnistaminen ja epäjatkuva lähetys 3G mediayhdyskäytävässä | |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 2006 |
Sivut: | ix + 92 s. + liitt. 18 Kieli: eng |
Koulu/Laitos/Osasto: | Sähkö- ja tietoliikennetekniikan osasto |
Oppiaine: | Akustiikka ja äänenkäsittelytekniikka (S-89) |
Valvoja: | Alku, Paavo |
Ohjaaja: | Himanen. Teemu |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark S80 | Arkisto |
Avainsanat: | acoustic signal analysis discontinuous transmission voice activity detection silence suppression subjective listening quality objective listening quality äänisignaalin analysointi epäjatkuva lähetys puheaktiivisuuden tunnistus hiljaisuuden poistaminen subjektiivinen puheen laatu objektiivinen puheenlaatu |
Tiivistelmä (fin): | Jotta VoIP-verkoissa voitaisiin vähentää lähetettävien pakettien määrää, verkkoon tuleva akustinen signaali määritetään puheaktiivisuuden mukaan joko aktiiviseksi tai epäaktiiviseksi. Aktiivinen signaali on tärkeää informaation välityksessä, kun taas epäaktiivinen signaali on kohinaa tai hiljaisuutta, joka voidaan olla lähettämättä verkkoon, jotta lähetykseen vaadittavaa kaistanleveyttä voitaisiin vähentää. Signaalin määritystä puheeksi tai kohinaksi kutsutaan puheaktiivisuuden tunnistamiseksi ja lähetyksen ajoittaista katkaisemista epäjatkuvaksi lähetykseksi. Tämän työn tarkoituksena on arvioida kolmea algoritmia, joita voidaan käyttää puheaktiivisuuden tunnistukseen ja keinotekoisen taustakohinan tuottamiseen vastaanottimessa. Tärkein päämäärä on löytää algoritmi, joka kykenee toimimaan laadukkaan puhekoodeista riippumattoman puheaktiivisuuden-tunnistusalgoritmin pohjana. Tavoitteena on arvioida algoritmeja analysoimalla saavutettua puheenlaatua ja säästöjä kaistanleveydessä. Suurimmat ongelmat epäjatkuvassa lähetyksessä ovat toisinaan tapahtuva puheen määritys kohinaksi ja taustakohinan tason virheellinen arviointi. Tutkittuja algoritmeja analysoidaan käyttämällä hyväksi sekä objektiivisia että subjektiivisia menetelmiä, joiden avulla pyritään saamaan selville, kuinka kuuntelijat reagoivat algoritmeissa mahdollisesti esiintyviin puutteisiin. Lisäksi työssä tarkastellaan, kuinka tarkan arvion subjektiivisesta äänenlaadusta ihmisen kuuloa jäljittelevä psykoakustinen malli kykenee antamaan kohinaisilla näytteillä. Objektiivisten mittausten ja suoritetun ACR-kuuntelutestin tulokset osoittivat, että käytettäessä laadukasta algoritmia kuuntelijat eivät kyenneet havaitsemaan eroa epäjatkuvan ja jatkuvan lähetyksen välillä. Lisäksi kävi ilmi, että aika ajoin kuuntelijat suosivat epäjatkuvaa lähetystä, mikä oikeuttaa keinotekoisen kohinan käyttöön vastaanottimessa. Tutkimuksemme mukaan tutkittujen algoritmien tehokkuudet kaistanleveyden säästössä eivät olleet erityisen hyviä tietyillä taustakohinoilla, mutta säästöihin ei silti kannata pyrkiä puheenlaadun kustannuksella. Tuloksiemme perusteella objektiiviset menetelmät tuottavat epätarkkoja ennusteita subjektiivisesta puheenlaadusta, kun niitä käytetään kohinaisiin puhenäytteisiin. |
ED: | 2006-04-03 |
INSSI tietueen numero: 31474
+ lisää koriin
INSSI