haku: @keyword jälkisuodatus / yhteensä: 2
viite: 2 / 2
« edellinen | seuraava »
Tekijä:Jokinen, Emma
Työn nimi:Adaptive post-filtering of speech in mobile communications
Puheen adaptiivinen jälkisuodatus mobiililaitteissa
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2010
Sivut:x + 55 + [6]      Kieli:   eng
Koulu/Laitos/Osasto:Elektroniikan, tietoliikenteen ja automaation tiedekunta
Oppiaine:Akustiikka ja äänenkäsittelytekniikka   (S-89)
Valvoja:Alku, Paavo
Ohjaaja:
Elektroninen julkaisu: http://urn.fi/URN:NBN:fi:aalto-201203131510
OEVS:
Digitoitu arkistokappale luettavissa Harald Herlin -oppimiskeskuksen asiakaskoneilla | ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto  807   | Arkisto
Avainsanat:speech enhancement
post-filtering
fomant
puheen ehostus
jälkisuodatus
formantti
Tiivistelmä (fin): Puheen ehostusta tarvitaan kohinaisen puheen laadun ja ymmärrettävyyden parantamisessa.
Tässä työssä suunniteltiin matkapuhelimiin tarkoitettu jälkisuodatusalgoritmi.
Tämän jälkiprosessoinnin tarkoituksena oli korostaa joitakin taajuusalueita puheessa siten, että sen ymmärtäminen olisi edelleen mahdollista hyvin kovassa kohinassa.
Jälkiprosessoinnin alussa soinnillisen puhekehyksen formanttitaajuudet haettiin tarkastelemalla sen LP-spektrissä olevia piikkejä.
Tämän jälkeen ensimmäistä löydettyä formanttia vaimennettiin ja toista vahvistettiin.
Ideana oli siirtää energiaa korkeammille taajuuksille, jossa kohinan energiataso olisi matalampi.

Formanttisuotimen kertoimet optimoitiin kuuntelukokeen avulla ja sen mahdollinen kallistus kompensoitiin ensimmäisen asteen alipäästösuotimella.
Lopullisen jälkisuotimen suorituskykyä tarkasteltiin sekä tutkimalla sen vaikutusta erilaisiin soinnillisiin äänteisiin että vertailemalla suodinta muihin jälkisuotimiin.
Saatujen tulosten perusteella voitiin päätellä, että toteutettu menetelmä toimi halutulla tavalla ja onnistui parantamaan puheen ymmärrettävyyttä.
Tarkasteluissa tuli kuitenkin ilmi myös yllättäviä piirteitä, kuten formanttien siirtymisiä, jotka vaativat lisätutkimusta.
Verrattuna muihin jälkisuodatussysteemeihin, jotka on suunniteltu toimimaan kovassa kohinassa, työssä kehitetyn algoritmin etuna ovat sen adaptiivisuus ja säädettävyys.
Tiivistelmä (eng): Speech enhancement is needed to improve the quality and intelligibility of speech degraded by noise.
In this thesis, a post-filtering approach for the mobile communication environment was designed.
The purpose of this post-processing scheme was to enhance certain frequency regions of speech, so that when it was degraded with a very high level of noise, the speech could still be understood.

The post-processing worked by locating the formants of a voiced speech frame by extracting the peaks of the LP spectrum.
After this, the first formant was attenuated and the second one enhanced.
The idea was to move energy to higher frequencies where the energy level of the noise was lower.
The coefficients of the formant filter were optimized with informal listening tests, and the possible tilt of the filter was compensated with a first order low-pass filter.
The performance of the post-processing algorithm was studied by analyzing its effects on different voiced sounds and by comparing the filter to other post-filters.

It was concluded that the post-processing worked as intended and improved the intelligibility of speech.
Some unexpected behavior, such as shifted formants, was also encountered and needs to be further studied.
The advantages of this approach are its more adaptive and tunable structure compared to the other methods used for post-processing in high noise levels.
ED:2010-08-20
INSSI tietueen numero: 40198
+ lisää koriin
« edellinen | seuraava »
INSSI