haku: @instructor Kurimo, Mikko / yhteensä: 19
viite: 10 / 19
Tekijä:Keraudy, Stevan
Työn nimi:Histogram equalization for noise robust speech recognition
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2009
Sivut:(5+) 50      Kieli:   eng
Koulu/Laitos/Osasto:Tietotekniikan laitos
Koulutusohjelma:Tietotekniikan tutkinto-ohjelma
Oppiaine:Informaatiotekniikka   (T-61)
Valvoja:Oja, Erkki
Ohjaaja:Kurimo, Mikko
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto  7154   | Arkisto
Avainsanat:speech recognition
histogram equalization
noise robustness
Tiivistelmä (eng): Automatic speech recognition (ASR) is a fascinating field of science where the machine almost becomes human.
Being able to communicate naturally with a machine has been a dream for a long time.
Today, the technology makes it possible for the machine to understand human speech.
However the quality of recognition suffers a lot from surrounding noise, and noisy environments are our everyday life conditions.

This work presents a technique to improve noise robustness of ASR systems based on histogram equalization.
This method has been proven efficient in the field of image processing and here we show that it can he successfully applied to audio data too.
The idea behind it is to equalize noisy data and make it "sound like" clean data so that ASR systems trained on clean speech can recognize noisy speech more accurately.

Experiments are conducted on Helsinki University of Technology's ASR system, and show a significant improvement in large vocabulary continuous speech recognition of noisy data on Aurora 4 database.
ED:2009-10-05
INSSI tietueen numero: 38413
+ lisää koriin
INSSI