haku: @keyword äänisynteesi / yhteensä: 20
viite: 17 / 20
Tekijä: | Riionheimo, Janne |
Työn nimi: | Parameter Estimation of a Plucked String Synthesis Model via the Genetic Algorithm |
Julkaisutyyppi: | Diplomityö |
Julkaisuvuosi: | 2004 |
Sivut: | ix + 77 Kieli: eng |
Koulu/Laitos/Osasto: | Sähkö- ja tietoliikennetekniikan osasto |
Oppiaine: | Akustiikka ja äänenkäsittelytekniikka (S-89) |
Valvoja: | Välimäki, Vesa |
Ohjaaja: | |
OEVS: | Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossaOppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa. Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/ Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.
Kirjautuminen asiakaskoneille
Opinnäytteen avaaminen
Opinnäytteen lukeminen
Opinnäytteen tulostus
|
Sijainti: | P1 Ark S80 | Arkisto |
Avainsanat: | musical acoustics sound synthesis physical modeling synthesis plucked string synthesis parameter estimation genetic algorithm musiikkiakustiikka äänisynteesi fysikaalinen mallinnus kielimalli parametrien estimointi geneettinen algoritmi |
Tiivistelmä (fin): | Tämän diplomityön tavoitteena on ollut kehittää menetelmä, jonka avulla on mahdollista säätää soivan kielen synteesimallin parametrit siten, että lopputuloksena on aidon kielisoittimen kuuloinen ääni. Kyseistä kielimallia on käytetty intensiivisesti eri kielisoittimien äänisynteesiin, mutta puoliautomaattisella menetelmällä tehty parametrien hienosäätö on vaatinut käyttäjältä harjaantuneisuutta ja tarkkaa kuuntelukykyä. Tässä diplomityössä esitellyn menetelmän avulla kielimallin parametrit voidaan säätää automaattisesti. Tämän diplomityön parametrien estimointimenetelmässä käytetään aikaisemmin äänitettyjä kielisoittimien ääniä tavoiteääninä, joihin synteesimallin tuottamia ääniä verrataan. Syntetisoidut äänet järjestetään niiden perkeptuaalisen virheen avulla. Perkeptuaalinen virhe lasketaan menetelmällä, joka simuloi ihmisen kuuloaistia ja huomioi kuuloaistin rajoitteet kuten taajuusriippuvuuden ja peittoilmiön. Tavoitteena on löytää syntetisoitu ääni jolla on mahdollisimman pieni perkeptuaalinen virhearvo. Tämän minimin löytämiseksi käytetään geneettistä algoritmia. Tässä diplomityössä käsitellään ensin synteesiin käytettävän kielimallin toiminta ja estimoitavat parametrit. Tämän jälkeen kuvataan estimointiin tarvittavan geneettinen algoritmin toiminta ja laskentaan vaikuttavat tekijät. Seuraavaksi esitellään perkeptuaaliseen virheenlaskentaan käytettävä funktio ja sen kuuloaistia simuloivat ominaisuudet. Tämän jälkeen käsitellään parametrien diskretointi sekä esitellään parameterien estimoinnin lopullinen toteutus ja viimeisenä käydään läpi koejärjestelyt sekä tulokset. Diplomityössä käsitelty menetelmä mahdollistaa parempilaatuisen äänisynteesin kyseisellä kielimallilla ja antaa myös tietoa kielimallin toiminnasta sekä parametrien suhteellisesta vaikutuksesta lopulliseen ääneen. |
Tiivistelmä (eng): | The aim of this thesis was to develop a method for adjusting the parameters of an existing plucked string synthesis model in such way that the final sound output is perceptually similar to the sound of a real instrument. The existing model has been intensively used for sound synthesis of various string instruments but the fine tuning of the parameters has been carried out with a semiautomatic method that requires some hand adjustment with human listening. By means of the method described in this thesis the parameters of the string model can be now adjusted automatically. In this thesis previously recorded tones are used as a target with which the synthesized tones are compared. All synthesized tones are then ranked according to their perceptual error value. The perceptual error value is calculated with a method that simulates human hearing and takes its limitations such as frequency dependence and frequency masking into account. The aim is to find a synthesized tone with minimal perceptual error value. In this thesis a genetic algorithm is used to find the minimum. First, this thesis introduces the plucked string synthesis model and its parameters. Then, the principle of a genetic algorithm and different operators are explained. Thereafter, the calculation of perceptual error value is described. Discretization of the parameters and the implementation of the parameter estimation algorithm are then explained and finally the experimentation and results are shown. The method described in this thesis enables high quality of synthesis with the plucked string synthesis model and also illustrates the behaviour of the model and clarify how the parameters affect to the final sound output. |
ED: | 2004-09-21 |
INSSI tietueen numero: 26317
+ lisää koriin
INSSI