Institute of Computer Science
  1. Courses
  2. 2023/24 fall
  3. Applied Data Science (LTAT.TK.048)
ET
Log in

Applied Data Science 2023/24 fall

  • Pealeht
  • Koolituse sisu ja ajakava
  • Koolituse korraldus
  • Koolituse materjalid
  • Praktikumid

Koolituse sisu ja ajakava

NrAegTeemaSisu
1.1.-8.septSissejuhatusMis on andmeteadus? Kus ja milleks andmeteadust kasutatakse? Mis on andmeteaduse edulood? Koolituse korralduse ja kasutatava tarkvara (Python, Jupyter Notebook, GPT-4) tutvustamine. Tekstirobotite (nt GPT-4) kasutamise alused.
2.8.-15.septAndmete mõistmine ja eeltöötlusPõhilised andmetüübid, histogrammid, tõenäosusjaotused, nende visualiseerimine, korrelatsioon ja põhjuslikkus. Andmete puhastamine ja puuduvate väärtuste asendamine.
3.15.-22.septAndmete visualiseerimineGraafiku osad ning nende komponeerimine kasutades graafikute grammatikat. Peamised graafikute tüübid ning nende kasutus, praktilised nõuanded graafikute valimisel.
4.22.-29.septJuhendamata masinõpeAndmete vektoresitused. - klasterdamine, k-keskmiste meetod, hierarhiline klasterdamine, kaugusmõõdud. Peakomponentanalüüs (PCA), keeruliste struktuursete andmete vektoresitused (embeddings).
5.29.sept.-6.oktKlassikaline juhendatud masinõpeKlassikaline juhendatud masinõpe - klassifitseerimine, otsustuspuud, K lähima naabrite meetod, tugivektormasinad (SVM), ansambelmeetodid. Regressioon, lineaarregressioon.
6.6.-13.oktMasinõppe töövoog. TehisnärvivõrgudÜlesobitamine, regulariseerimine, ristvalideerimine, hüperparameetrite optimeerimine, masinõppe töövoog. Tehisnärvivõrgu mõiste, võrgu treenimine, tavalisemad arhitektuurid - pärilevivõrgud, konvolutsioonid, rekurrentsed võrgud, transformerid.
7.13.-20.oktStatistika alusedValim ja populatsioon, hüpoteeside testimise alused, p-väärtus, permutatsioonitest, usalduspiirid, t-test, aegread, autokorrelatsioon.
8.20.-27.oktCRISP-DM metoodika. Tüüpvead andmeanalüüsis ja masinõppesCRISP-DM metoodika, selle etapid ja nende olulisus, CRISP-DM itereerimine, rakendamine moodsas andmeteaduses. Tüüpvead andmeanalüüsis ja masinõppes - andmete kogumise vead, ekslikud statistilised järeldused, eelarvamuste mõju ja kinnitamine, andmeleke masinõppes, andmenihe.
9.27.okt-3.novAndmebaasid. Privaatsus.Relatsioonilised andmebaasid ja SQL, mitte-relatsioonilised andmebaasid ja päringukeeled, andmete turvalisus. Privaatsus, anonümiseerimine, diskrimineerimine, andmekaitse, GDPR.
10.3.-17.novKursuse projektPraktilise andmeteadusliku ülesande lahendamine enda valitud teemal kuni kolmeliikmelises rühmas
  • Institute of Computer Science
  • Faculty of Science and Technology
  • University of Tartu
In case of technical problems or questions write to:

Contact the course organizers with the organizational and course content questions.
The proprietary copyrights of educational materials belong to the University of Tartu. The use of educational materials is permitted for the purposes and under the conditions provided for in the copyright law for the free use of a work. When using educational materials, the user is obligated to give credit to the author of the educational materials.
The use of educational materials for other purposes is allowed only with the prior written consent of the University of Tartu.
Terms of use for the Courses environment