haku: @keyword image processing / yhteensä: 26
viite: 5 / 26
Tekijä:Akusok, Anton
Työn nimi:Machine Learning for Internet Security: Malware Detection and Web Image Classification
Julkaisutyyppi:Diplomityö
Julkaisuvuosi:2013
Sivut:70      Kieli:   eng
Koulu/Laitos/Osasto:Perustieteiden korkeakoulu
Oppiaine:Informaatiotekniikka   (T-115)
Valvoja:Simula, Olli
Ohjaaja:Lendasse, Amaury ; Miche, Yoan
OEVS:
Sähköinen arkistokappale on luettavissa Aalto Thesis Databasen kautta.
Ohje

Digitaalisten opinnäytteiden lukeminen Aalto-yliopiston Harald Herlin -oppimiskeskuksen suljetussa verkossa

Oppimiskeskuksen suljetussa verkossa voi lukea sellaisia digitaalisia ja digitoituja opinnäytteitä, joille ei ole saatu julkaisulupaa avoimessa verkossa.

Oppimiskeskuksen yhteystiedot ja aukioloajat: https://learningcentre.aalto.fi/fi/harald-herlin-oppimiskeskus/

Opinnäytteitä voi lukea Oppimiskeskuksen asiakaskoneilla, joita löytyy kaikista kerroksista.

Kirjautuminen asiakaskoneille

  • Aalto-yliopistolaiset kirjautuvat asiakaskoneille Aalto-tunnuksella ja salasanalla.
  • Muut asiakkaat kirjautuvat asiakaskoneille yhteistunnuksilla.

Opinnäytteen avaaminen

  • Asiakaskoneiden työpöydältä löytyy kuvake:

    Aalto Thesis Database

  • Kuvaketta klikkaamalla pääset hakemaan ja avaamaan etsimäsi opinnäytteen Aaltodoc-tietokannasta. Opinnäytetiedosto löytyy klikkaamalla viitetietojen OEV- tai OEVS-kentän linkkiä.

Opinnäytteen lukeminen

  • Opinnäytettä voi lukea asiakaskoneen ruudulta tai sen voi tulostaa paperille.
  • Opinnäytetiedostoa ei voi tallentaa muistitikulle tai lähettää sähköpostilla.
  • Opinnäytetiedoston sisältöä ei voi kopioida.
  • Opinnäytetiedostoa ei voi muokata.

Opinnäytteen tulostus

  • Opinnäytteen voi tulostaa itselleen henkilökohtaiseen opiskelu- ja tutkimuskäyttöön.
  • Aalto-yliopiston opiskelijat ja henkilökunta voivat tulostaa mustavalkotulosteita Oppimiskeskuksen SecurePrint-laitteille, kun tietokoneelle kirjaudutaan omilla Aalto-tunnuksilla. Väritulostus on mahdollista asiakaspalvelupisteen tulostimelle u90203-psc3. Väritulostaminen on maksullista Aalto-yliopiston opiskelijoille ja henkilökunnalle.
  • Ulkopuoliset asiakkaat voivat tulostaa mustavalko- ja väritulosteita Oppimiskeskuksen asiakaspalvelupisteen tulostimelle u90203-psc3. Tulostaminen on maksullista.
Sijainti:P1 Ark Aalto  8662   | Arkisto
Avainsanat:classification
nominal data
image processing
local features
ELM
Tiivistelmä (eng): In today's fast-moving Internet-driven world, new opportunities are emerging to take advantage of the latest technologies.
However, this trend of empowerment is not only available for the good, but also for various questionable and criminal activities.

The first part of the thesis addresses the problem of the automatic mal ware detection.
An unusual restriction applied to malware classification is the strict zero False Positives rate.
To satisfy this restriction, a two-stage methodology is proposed.
Due to nominal features representation, an adaptation of the Min Hash algorithm is used on the first stage, balanced in accuracy and running time.
The second stage classifier uses two ELMs, each with a hyper-parameter adjusting the trade-off between coverage and an amount of False Positives/Negatives.
Final outputs include the third "unknown" class; sacrificing some coverage to achieve a really low zero False Positives rate (2 out of 38,000 on test set).

The second half of the thesis explores the web image classification for the web content filtering.
The training dataset inherits properties of real web images: high variability, often weak clues to the website class, and a high amount of semantic noise.
For the classification, a suitable image representation and a two-stage methodology are proposed.
Images are represented by their local features, with the local feature descriptors being the smallest processing unit.
On the first stage, the class probability density in the descriptor space is estimated with a random Vector Quantization.
On the second stage, classes of images are derived from their classified descriptors, in the image-to-class fashion.
The approach provides the average accuracy of 35% in a 10-class setting, with the particular accuracy for an "Adult" class over 70%.
ED:2013-04-03
INSSI tietueen numero: 46037
+ lisää koriin
INSSI