haku: @keyword sound synthesis / yhteensä: 12
viite: 10 / 12
Tekijä:Riionheimo, Janne
Työn nimi:Parameter Estimation of a Plucked String Synthesis Model via the Genetic Algorithm
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2004
Sivut:ix + 77      Kieli:   eng
Koulu/Laitos/Osasto:Sähkö- ja tietoliikennetekniikan osasto
Oppiaine:Akustiikka ja äänenkäsittelytekniikka   (S-89)
Valvoja:Välimäki, Vesa
Ohjaaja:
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark S80     | Arkisto
Avainsanat:musical acoustics
sound synthesis
physical modeling synthesis
plucked string synthesis
parameter estimation
genetic algorithm
musiikkiakustiikka
äänisynteesi
fysikaalinen mallinnus
kielimalli
parametrien estimointi
geneettinen algoritmi
Tiivistelmä (fin): Tämän diplomityön tavoitteena on ollut kehittää menetelmä, jonka avulla on mahdollista säätää soivan kielen synteesimallin parametrit siten, että lopputuloksena on aidon kielisoittimen kuuloinen ääni.
Kyseistä kielimallia on käytetty intensiivisesti eri kielisoittimien äänisynteesiin, mutta puoliautomaattisella menetelmällä tehty parametrien hienosäätö on vaatinut käyttäjältä harjaantuneisuutta ja tarkkaa kuuntelukykyä.
Tässä diplomityössä esitellyn menetelmän avulla kielimallin parametrit voidaan säätää automaattisesti.

Tämän diplomityön parametrien estimointimenetelmässä käytetään aikaisemmin äänitettyjä kielisoittimien ääniä tavoiteääninä, joihin synteesimallin tuottamia ääniä verrataan.
Syntetisoidut äänet järjestetään niiden perkeptuaalisen virheen avulla.
Perkeptuaalinen virhe lasketaan menetelmällä, joka simuloi ihmisen kuuloaistia ja huomioi kuuloaistin rajoitteet kuten taajuusriippuvuuden ja peittoilmiön.
Tavoitteena on löytää syntetisoitu ääni jolla on mahdollisimman pieni perkeptuaalinen virhearvo.
Tämän minimin löytämiseksi käytetään geneettistä algoritmia.

Tässä diplomityössä käsitellään ensin synteesiin käytettävän kielimallin toiminta ja estimoitavat parametrit.
Tämän jälkeen kuvataan estimointiin tarvittavan geneettinen algoritmin toiminta ja laskentaan vaikuttavat tekijät.
Seuraavaksi esitellään perkeptuaaliseen virheenlaskentaan käytettävä funktio ja sen kuuloaistia simuloivat ominaisuudet.
Tämän jälkeen käsitellään parametrien diskretointi sekä esitellään parameterien estimoinnin lopullinen toteutus ja viimeisenä käydään läpi koejärjestelyt sekä tulokset.

Diplomityössä käsitelty menetelmä mahdollistaa parempilaatuisen äänisynteesin kyseisellä kielimallilla ja antaa myös tietoa kielimallin toiminnasta sekä parametrien suhteellisesta vaikutuksesta lopulliseen ääneen.
Tiivistelmä (eng): The aim of this thesis was to develop a method for adjusting the parameters of an existing plucked string synthesis model in such way that the final sound output is perceptually similar to the sound of a real instrument.
The existing model has been intensively used for sound synthesis of various string instruments but the fine tuning of the parameters has been carried out with a semiautomatic method that requires some hand adjustment with human listening.
By means of the method described in this thesis the parameters of the string model can be now adjusted automatically.

In this thesis previously recorded tones are used as a target with which the synthesized tones are compared.
All synthesized tones are then ranked according to their perceptual error value.
The perceptual error value is calculated with a method that simulates human hearing and takes its limitations such as frequency dependence and frequency masking into account.
The aim is to find a synthesized tone with minimal perceptual error value.
In this thesis a genetic algorithm is used to find the minimum.

First, this thesis introduces the plucked string synthesis model and its parameters.
Then, the principle of a genetic algorithm and different operators are explained.
Thereafter, the calculation of perceptual error value is described.
Discretization of the parameters and the implementation of the parameter estimation algorithm are then explained and finally the experimentation and results are shown.

The method described in this thesis enables high quality of synthesis with the plucked string synthesis model and also illustrates the behaviour of the model and clarify how the parameters affect to the final sound output.
ED:2004-09-21
INSSI tietueen numero: 26317
+ lisää koriin
INSSI