search query: @keyword feature extraction / total: 22
reference: 7 / 22
« previous | next »
Author:Kallasjoki, Heikki
Title:Methods for spectral envelope estimation in noise robust speech recognition
Menetelmiä spektrin verkkokäyrän mallintamiseen kohinasietoista puheentunnistusta varten
Publication type:Master's thesis
Publication year:2009
Pages:(10) + 62      Language:   eng
Department/School:Tietotekniikan laitos
Degree programme:Tietotekniikan tutkinto-ohjelma
Main subject:Informaatiotekniikka   (T-61)
Supervisor:Oja, Erkki
Instructor:Palomäki, Kalle
Digitized copy: https://aaltodoc.aalto.fi/handle/123456789/96810
OEVS:
Digitized archive copy is available in Aaltodoc
Location:P1 Ark Aalto  7209   | Archive
Keywords:automatic speech recognition
feature extraction
spectral envelope estimation
weighted linear prediction
automaattinen puheentunnistus
piirreirroitus
spektrin verhokäyrän mallinnus
painotettu lineaariprediktio
Abstract (fin): Puheentunnistusjärjestelmien käytännön sovellusten on toimittava haasteellisissa ympäristöissä, joissa tietoa mahdollisten häiriöäänien laadusta ei välttämättä ole saatavilla ennakkoon.
Puhesignaalin lyhytaikaisen spektrin verhokäyrä sisältää puheen välittämään viestiin liittyvän tiedon muodossa, joka sietää kohinaa paremmin kuin sen perustana oleva spektri.
Malleja verhokäyrästä voidaankin siten käyttää tuottamaan puhesignaaleille piirre-esitystapoja, joihin ympäristöstä peräisin olevat häiriöäänet vaikuttavat vähemmän.

Tässä työssä eri menetelmiä verhokäyrän mallintamiseen tarkastellaan osana laajan sanavaraston jatkuvan puheen tunnistusjärjestelmän piirreirroitusta.
Tunnistusvirheiden määrää todellisissa kohinaisissa ympäristöissä nauhoitetulle puheelle vertaillaan eri piirre-esitystapojen välillä.
Vertailtavat piirteet perustuvat perinteiseen, painotettuun ja hiljattain esiteltyyn stabiloituun painotettuun lineaariprediktioon.
Myös menetelmiä stabiloidun painotetun lineaariprediktion parametrien automaattiseen mukautukseen analysoitavalle äänisignaalille sopivaksi tutkitaan.
Merkittävästi parempia tunnistustuloksia saavutetaan perinteiseen ja painotettuun lineaariprediktioon perustuvia verhokäyrän malleja käyttävillä piirteillä, kun tunnistettavana on kohinaista puhetta ja käytetään puhtaalla puheella opetettuja akustisia malleja.
ED:2009-10-05
INSSI record number: 38405
+ add basket
« previous | next »
INSSI