Arvutiteaduse instituut
  1. Kursused
  2. 2023/24 sügis
  3. Praktiline andmeteadus (LTAT.TK.048)
EN
Logi sisse

Praktiline andmeteadus 2023/24 sügis

  • Pealeht
  • Koolituse sisu ja ajakava
  • Koolituse korraldus
  • Koolituse materjalid
  • Praktikumid

Koolituse sisu ja ajakava

NrAegTeemaSisu
1.1.-8.septSissejuhatusMis on andmeteadus? Kus ja milleks andmeteadust kasutatakse? Mis on andmeteaduse edulood? Koolituse korralduse ja kasutatava tarkvara (Python, Jupyter Notebook, GPT-4) tutvustamine. Tekstirobotite (nt GPT-4) kasutamise alused.
2.8.-15.septAndmete mõistmine ja eeltöötlusPõhilised andmetüübid, histogrammid, tõenäosusjaotused, nende visualiseerimine, korrelatsioon ja põhjuslikkus. Andmete puhastamine ja puuduvate väärtuste asendamine.
3.15.-22.septAndmete visualiseerimineGraafiku osad ning nende komponeerimine kasutades graafikute grammatikat. Peamised graafikute tüübid ning nende kasutus, praktilised nõuanded graafikute valimisel.
4.22.-29.septJuhendamata masinõpeAndmete vektoresitused. - klasterdamine, k-keskmiste meetod, hierarhiline klasterdamine, kaugusmõõdud. Peakomponentanalüüs (PCA), keeruliste struktuursete andmete vektoresitused (embeddings).
5.29.sept.-6.oktKlassikaline juhendatud masinõpeKlassikaline juhendatud masinõpe - klassifitseerimine, otsustuspuud, K lähima naabrite meetod, tugivektormasinad (SVM), ansambelmeetodid. Regressioon, lineaarregressioon.
6.6.-13.oktMasinõppe töövoog. TehisnärvivõrgudÜlesobitamine, regulariseerimine, ristvalideerimine, hüperparameetrite optimeerimine, masinõppe töövoog. Tehisnärvivõrgu mõiste, võrgu treenimine, tavalisemad arhitektuurid - pärilevivõrgud, konvolutsioonid, rekurrentsed võrgud, transformerid.
7.13.-20.oktStatistika alusedValim ja populatsioon, hüpoteeside testimise alused, p-väärtus, permutatsioonitest, usalduspiirid, t-test, aegread, autokorrelatsioon.
8.20.-27.oktCRISP-DM metoodika. Tüüpvead andmeanalüüsis ja masinõppesCRISP-DM metoodika, selle etapid ja nende olulisus, CRISP-DM itereerimine, rakendamine moodsas andmeteaduses. Tüüpvead andmeanalüüsis ja masinõppes - andmete kogumise vead, ekslikud statistilised järeldused, eelarvamuste mõju ja kinnitamine, andmeleke masinõppes, andmenihe.
9.27.okt-3.novAndmebaasid. Privaatsus.Relatsioonilised andmebaasid ja SQL, mitte-relatsioonilised andmebaasid ja päringukeeled, andmete turvalisus. Privaatsus, anonümiseerimine, diskrimineerimine, andmekaitse, GDPR.
10.3.-17.novKursuse projektPraktilise andmeteadusliku ülesande lahendamine enda valitud teemal kuni kolmeliikmelises rühmas
  • Arvutiteaduse instituut
  • Loodus- ja täppisteaduste valdkond
  • Tartu Ülikool
Tehniliste probleemide või küsimuste korral kirjuta:

Kursuse sisu ja korralduslike küsimustega pöörduge kursuse korraldajate poole.
Õppematerjalide varalised autoriõigused kuuluvad Tartu Ülikoolile. Õppematerjalide kasutamine on lubatud autoriõiguse seaduses ettenähtud teose vaba kasutamise eesmärkidel ja tingimustel. Õppematerjalide kasutamisel on kasutaja kohustatud viitama õppematerjalide autorile.
Õppematerjalide kasutamine muudel eesmärkidel on lubatud ainult Tartu Ülikooli eelneval kirjalikul nõusolekul.
Courses’i keskkonna kasutustingimused