Teemad

Siin on esialgne teemade loetelu. Enne esimest seminari proovin leida algatuseks vähemalt ühe artikli iga teema kohta. Muidugi võib üles näidata ka oma initsiatiivi ja otsida veebist, CiteSeer-ist ja mujalt.

Assotsiatsioonireeglid ja episoodid

Assotsiatsioonireeglid (sagedased hulgad) ja apriori algoritm

Sagedased episoodid

  • Sündmused (näiteks veateated, logid jt) aja teljel; rakendused
  • Materjale

Reeglipõhised masinõppimise meetodid

Otsustuspuud ja -listid

  • ID3
  • Puu tipu jagamise reeglid, näiteks gini indeks jt.
  • C4.5 Tutorial
  • CN2
  • Materjale: PDF1 PDF2 PS
  • Teema autor: Kristo Käärmann
  • CODE: P02

Tree-pruning methods

  • Mis need on ja miks?
  • Kirjelda meetodeid.
  • Millised neist on head?
  • Materjale: PDF1 PDF2 PS

Inductive Logic Programming

Rough Sets in Machine Learning

  • Rough sets, Bioinformatics, ILP (Jan Komorowski)
  • Materjale: PDF1 PS2

Hierarchical Rule sets and Ripple Down Rules

  • Materjale: PS1

Reeglite headuse hindamiskriteeriumid

  • MDL (ja MML)
  • MDL ja MML printsiipide kasutus masinõppes.
  • Kuidas hinnata tuletatud teooriate-reeglite headust?
  • MDL printsiip (Minimum Description Length)
  • MML - minimum message length measure.
  • http://www.mdl-research.org/
  • Materjale
  • Teema autor: Meelis Kull
  • CODE: P04

Measuring the quality of learned predictors

  • precision
  • recall
  • accuracy
  • ROC curve
  • Classifiers for rare cases
  • Materjale: PDF1 PDF2

Masinõppimise treenimise ja parandamise meetodid

  • Jacknife
  • Leave one out
  • ...

Klassifitseerijate kombineerimine

Klasteranalüüs

  • Klasteranalüüs
  • Hierarhiline
  • K-means
  • Fuzzy C-means
  • Materjale: PDF1 PDF2 PDF3 PDF4 PS1 PS2 PS3
  • Teema autor: Mihhail Juhkam
  • CODE: P05

Sarnasuse mõõdust klasteranalüüsis

  • Sarnasuse ja kauguse hindamise mõõdud
  • Dimensionaalsuse needus
  • Sarnasuse mõõt ja klasterduse kiirendamine kolmnurga võrratuse abil
  • Materjale: PDF1 PDF2PDF3 PDF4 PS1 PS2 PS3
  • Teema autor: Mart Sõmermaa
  • CODE: P06

Mustrite otsimine

Sagedasti esinevate stringi-mustrite otsimine

Arvutuslikud, tõenäosuslikud, jne meetodid

Närvivõrgud

  • Perceptron ja tema omadused-puudused (2lk)
  • Keerulisemad võrgud, peidetud tasemed
  • Treenimise levinumad meetodid

Bayesi võrgud (alused)

Kernel methods and SVM (Support Vector Machines)

Expectation Maximization

  • EM kui optimeerimismeetod?
  • Teema autor: Jelena Zaitseva
  • CODE: P10

Andmekaevanduse rakendusi

Text mining

  • (Vabast) tekstist info eraldamine
  • Infopäringud tekstiandmebaasidesse jne
  • Mis miks kuidas tehakse text miningut
  • Teadusartiklite abstraktide analüüs valkude kohta info saamiseks
  • Ronen Feldman
  • ClearForest
  • Materjale: PDF1 PDF2 PDF3 PS1
  • Teema autor: Jüri Reimand
  • CODE: P11

Data Mining Bioinformaatikas

Data Mining Meditsiini-informaatikas

Muid rakendusi, arengusuundi jne

Võib valida ka järgmisi teemasid: Mixture Modelling and LVQ - learning vector quantization. Independent Copmponent Analysis

Edit: header| contents| footer| sidebar