haku: @instructor Kurimo, Mikko / yhteensä: 19
viite: 10 / 19
Tekijä: | Keraudy, Stevan |
Työn nimi: | Histogram equalization for noise robust speech recognition |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 2009 |
Sivut: | (5+) 50 Kieli: eng |
Koulu/Laitos/Osasto: | Tietotekniikan laitos |
Koulutusohjelma: | Tietotekniikan tutkinto-ohjelma |
Oppiaine: | Informaatiotekniikka (T-61) |
Valvoja: | Oja, Erkki |
Ohjaaja: | Kurimo, Mikko |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark Aalto 7154 | Arkisto |
Avainsanat: | speech recognition histogram equalization noise robustness |
Tiivistelmä (eng): | Automatic speech recognition (ASR) is a fascinating field of science where the machine almost becomes human. Being able to communicate naturally with a machine has been a dream for a long time. Today, the technology makes it possible for the machine to understand human speech. However the quality of recognition suffers a lot from surrounding noise, and noisy environments are our everyday life conditions. This work presents a technique to improve noise robustness of ASR systems based on histogram equalization. This method has been proven efficient in the field of image processing and here we show that it can he successfully applied to audio data too. The idea behind it is to equalize noisy data and make it "sound like" clean data so that ASR systems trained on clean speech can recognize noisy speech more accurately. Experiments are conducted on Helsinki University of Technology's ASR system, and show a significant improvement in large vocabulary continuous speech recognition of noisy data on Aurora 4 database. |
ED: | 2009-10-05 |
INSSI tietueen numero: 38413
+ lisää koriin
INSSI