Arvutiteaduse instituut
  1. Kursused
  2. 2025/26 sügis
  3. Andmeteaduse abimees 2025 sügis (LTAT.00.999)
EN
Logi sisse

Andmeteaduse abimees 2025 sügis 2025/26 sügis

  • Pealeht
  • Sissejuhatus
  • IT
  • Python
  • SQL
  • R
  • Koodihaldus
  • Excel
  • Visualiseerimine
  • UNIX
  • Maths
  • Viited

2025 vastuvõetute infomaterjalid

3.-4. september (kolmapäev-neljapäev) kell 16:15 - 18:00
Delta ruum 1008

Väike sissejuhatus andmeteaduse II kursuse tudengitelt. Palun võtta kaasa koolitööks kasutatav sülearvuti!

3. september 2025 -- töömasina seadistamine

Sisukord

  1. Käsurea põhitõed
  2. Pythoni paigaldamine
  3. Git-i seadistamine
  4. GitHub/GitLab Konto
  5. Conda Keskkonnad
  6. IDE Valik
  7. Probleemide Lahendamine

See juhendmaterjal aitab teil seadistada oma arvuti koolitööks.


1. Käsurea Põhitõed

Mis on käsurida?

Käsurida (Command Line Interface - CLI) on tekstipõhine viis arvutiga suhtlemiseks.

Käsurea avamine Windows-is

  • Command Prompt (cmd):
   -> Vajutage Win + R, kirjutage "cmd" ja vajutage Enter
   -> Või otsige "Command Prompt" Start menüüst (või lihtsalt "cmd")

Peamised käsurea käsud

Kaustade navigeerimine
  • Vaata, kus sa oled

pwd

  • Vaata kaustade sisu

dir

  • Liigu kausta

cd kausta_nimi

  • Liigu ühe taseme võrra üles

cd ..

  • Liigu kodukausta

cd ~

  • Liigu C: kettale

cd C:\

Kaustade ja failide loomine
  • Loo uus kaust

mkdir uus_kaust

  • Loo uus fail

echo "Sisu" > uus_fail.txt

  • Loo mitu kausta korraga

mkdir kaust1 kaust2 kaust3

Python käivitamine
  • Käivita Python

python

  • Käivita Python skript

python minu_skript.py

  • Kontrolli Python versiooni

python --version


2. Tarkvara Allalaadimine ja Paigaldamine

Python

  • Mine veebilehele: https://www.python.org/downloads/
  • Laadi alla uusim versioon (3.12 või uuem)
  • Paigalda - OLULINE: Märkige "Add Python to PATH"
  • Kontrolli paigaldust:

python --version pip --version

Git

  • Mine veebilehele: https://git-scm.com/download/win
  • Laadi alla ja paigalda
  • Kontrolli paigaldust:

git --version

  • Seadista Git:

git config --global user.name "Teie Nimi" git config --global user.email "teie.email@example.com"

Anaconda

  • Mine veebilehele: https://www.anaconda.com/download
  • Laadi alla Anaconda Individual Edition
  • Paigalda - valige "Add Anaconda to PATH"
  • Kontrolli paigaldust:

conda --version

IDE-d (Integreeritud Arenduskeskkonnad)

Visual Studio Code
  • Mine veebilehele: https://code.visualstudio.com/
  • Laadi alla ja paigalda
  • Soovitatavad laiendused:
   -> Python
   -> GitLens
   -> Jupyter
PyCharm Community Edition
  • Mine veebilehele: https://www.jetbrains.com/pycharm/download/
  • Laadi alla Community Edition (tasuta)
  • Paigalda
Cursor
  • Mine veebilehele: https://cursor.sh/
  • Laadi alla ja paigalda
  • AI-põhine koodiredaktor

3. Git ja GitHub

Mis on Git?

Git on versioonihaldussüsteem, mis aitab jälgida failide muudatusi ja töötada koos teistega.

GitHub konto loomine

  • Mine veebilehele: https://github.com
  • Loo tasuta konto
  • Kinnita e-mail

Git põhitoimingud

Projekti loomine
  • Loo uus kaust projekti jaoks

mkdir minu_projekt cd minu_projekt

  • Initsialiseeri Git repositoorium

git init

  • Loo README fail

echo "# Minu Projekt" > README.md

  • Lisa failid Git-ile

git add .

  • Tee esimene commit

git commit -m "Esimene commit"

GitHub-iga ühendamine
  • Lisa GitHub repositoorium

git remote add origin https://github.com/teie-kasutajanimi/minu-projekt.git

  • Saada kood GitHub-isse

git push -u origin main

Projekti kloonimine
  • Klooni olemasolev projekt

git clone https://github.com/teie-kasutajanimi/projekt.git

  • Liigu projekti kausta

cd projekt

Töövoog (Workflow)
  • Vaata failide staatust

git status

  • Lisa muudatused

git add faili_nimi.py

  • või kõik failid

git add .

  • Tee commit

git commit -m "Kirjeldus muudatustest"

  • Saada GitHub-isse

git push

Uuenduste laadimine
  • Laadi uuendused GitHub-ist

git pull

Branchimine (Harude loomine)

  • Vaata olemasolevaid harusid

git branch

  • Loo uus haru

git branch uus_funktsioon

  • Liigu uuele harule

git checkout uus_funktsioon

  • või uuemal Git-il

git switch uus_funktsioon

  • Tee muudatused ja commit

git add . git commit -m "Uus funktsioon lisatud"

  • Saada haru GitHub-isse

git push -u origin uus_funktsioon

Pull Request

  • Mine GitHub-i
  • Klõpsa "Compare & pull request"
  • Lisa kirjeldus
  • Saada pull request

4. Conda Keskkonnad

Mis on Conda?

Conda on paketihaldur ja keskkonna haldur Python-i jaoks. See aitab hallata erinevaid Python versioone ja teeke.

Miks on üks keskkond halb?

Probleemid ühe keskkonnaga:

  • Versioonikonfliktid: Erinevad projektid vajavad erinevaid teekide versioone
  • Süsteemi segamine: Paigaldatud teegid võivad mõjutada teisi projekte
  • Raskendatud koostöö: Teised ei saa reprodutseerida teie keskkonda
  • Uuenduste risk: Uuendused võivad rikkuda vanu projekte

Conda keskkondade loomine

Uue keskkonna loomine
  • Loo uus keskkond Python 3.11-ga

conda create -n andmeteadus python=3.11

  • Aktiveeri keskkond

conda activate andmeteadus

  • Paigalda teegid

conda install numpy pandas matplotlib jupyter

  • Või kasuta pip-i

pip install numpy pandas matplotlib jupyter

Keskkondade haldamine
  • Vaata kõiki keskkondi

conda env list

  • Aktiveeri keskkond

conda activate andmeteadus

  • Deaktiveeri keskkond

conda deactivate

  • Kustuta keskkond

conda env remove -n andmeteadus

Keskkonna eksportimine
  • Ekspordi keskkond faili

conda env export > environment.yml

  • Loo keskkond failist

conda env create -f environment.yml

Soovitatud töövoog

  • Iga projekti jaoks

mkdir uus_projekt cd uus_projekt

  • Loo uus keskkond

conda create -n projekt_nimi python=3.11

  • Aktiveeri keskkond

conda activate projekt_nimi

  • Paigalda vajalikud teegid

conda install numpy pandas matplotlib

  • Alusta tööd

jupyter notebook


5. Praktilised Näited

Täielik projekti seadistamine

  • 1. Loo projektikaust

mkdir minu_andmeteaduse_projekt cd minu_andmeteaduse_projekt

  • 2. Initsialiseeri Git

git init echo "# Minu Andmeteaduse Projekt" > README.md

  • 3. Loo Conda keskkond

conda create -n minu_projekt python=3.11 conda activate minu_projekt

  • 4. Paigalda teegid

conda install numpy pandas matplotlib jupyter

  • 5. Loo esimene Python fail

@@echo "import pandas as pd import numpy as np print('Tere, andmeteadus!')" > minu_skript.py@@

  • 6. Git commit

git add . git commit -m "Esimene andmeteaduse projekt"

  • 7. Ühenda GitHub-iga

git remote add origin https://github.com/teie-kasutajanimi/minu-projekt.git git push -u origin main

Jupyter Notebook käivitamine

  • Aktiveeri keskkond

conda activate minu_projekt

  • Käivita Jupyter

jupyter notebook

  • Või JupyterLab

jupyter lab


6. Kasulikud Käsud ja Näpunäited

Kiired käsud

  • Vaata käsurea ajalugu

history

  • Otsi faili

dir /s faili_nimi.txt

  • Kopeeri fail

copy fail1.txt fail2.txt

  • Liiguta fail

move fail1.txt kaust/

  • Kustuta fail

del faili_nimi.txt

  • Kustuta kaust

rmdir kausta_nimi

Git kiirkäsud

  • Vaata muudatusi

git diff

  • Vaata commit ajalugu

git log --oneline

  • Tühjenda staged failid

git reset

  • Tühjenda kõik muudatused

git checkout -- .

Conda kiirkäsud

  • Paigalda mitu teeki korraga

conda install numpy pandas matplotlib seaborn

  • Uuenda kõik teegid

conda update --all

  • Otsi teeki

conda search numpy


7. Probleemide Lahendamine

Levinud probleemid

"Python ei ole leitud"
  • Kontrollige, kas Python on PATH-is
  • Taaskäivitage käsurea aken
  • Paigalda Python uuesti "Add to PATH" valikuga
"Git ei ole leitud"
  • Kontrollige Git paigaldust
  • Taaskäivitage käsurea aken
"Conda ei ole leitud"
  • Kontrollige Anaconda paigaldust
  • Kasutage Anaconda Prompt-i
Git autentimise probleemid
  • Seadista Git credential helper

git config --global credential.helper manager-core


8. Järgmised Sammud

Kasulikud ressursid

  • Git dokumentatsioon: https://git-scm.com/doc
  • Python dokumentatsioon: https://docs.python.org/
  • Pandas dokumentatsioon: https://pandas.pydata.org/docs/
  • Conda dokumentatsioon: https://docs.conda.io/

4. september 2025 -- programmeerimine ja peamised paketid Pythonis

Palun alustuseks installeerida Anaconda https://www.anaconda.com/docs/getting-started/anaconda/install#windows-installation

Ilmaandmete Analüüs - Aegridade Töötlemine

Materjalid

Kõik vajalikud failid on saadaval GitHub repositooriumist: https://github.com/mrpae/andmeteadus-sissejuhatus2025

  • Peamised failid:**
  • ilmaandmete_analüüs.ipynb - Jupyter notebook ilmaandmete analüüsiga
  • ilmaandmed_näidis.csv - Ilmaandmete näidisandmestik (168 mõõtmist)
  • environment.yml - Conda keskkonna seadistus
  • requirements.txt - Python teekide nimekiri

Keskkonna seadistamine

Enne notebook'i käivitamist loo conda keskkond:

  • Loo uus conda keskkond Python 3.13-ga

conda create -n andmeteadus python=3.13

  • Aktiveeri keskkond

conda activate andmeteadus

  • Paigalda teegid requirements.txt failist

pip install -r requirements.txt

  • Kontrolli paigaldust

python -c "import pandas, numpy, matplotlib; print('Kõik teegid on paigaldatud!')"

  • Või kasuta environment.yml faili:

conda env create -f environment.yml conda activate andmeteadus

Notebook'i sisu

1. Andmete laadimine ja ettevalmistamine

  • Ilmaandmete laadimine CSV failist
  • DateTime indeksi loomine
  • Andmete puhastamine ja kontrollimine

2. Aegridade visualiseerimine

  • Temperatuuri, õhuniiskuse, tuule kiiruse ja atmosfääri rõhu aegridad
  • Seaborn heatmap korrelatsioonimaatriksiga
  • Histogrammid ja jaotused

3. Aegridade analüüs

  • Päevade kaupa statistika
  • Trendide leidmine (lineaarne regressioon)
  • Korrelatsioonide analüüs

4. Statistilised analüüsid

  • Põhistatistika (min, max, keskmine, standardhälve)
  • Korrelatsioonide arvutamine
  • Scatter plot'id seoste visualiseerimiseks

5. Iseseisvad ülesanded

Notebook sisaldab 4 iseseisvat ülesannet:

  • Ülesanne 1: Temperatuuri ekstreemumid - Leia kõige kõrgem/madalaim temperatuur
  • Ülesanne 2: Tuule analüüs - Analüüsi tuule suundade ja kiiruse jaotust
  • Ülesanne 3: Päevade võrdlus - Võrdle erinevaid päevi omavahel
  • Ülesanne 4: Andmete eksportimine - Loo kokkuvõtte ja salvesta tulemused

Õpitud oskused

Pandas aegridade töötlemine:

  • Andmete laadimine CSV failist
  • DateTime indeksi loomine
  • Aegridade resample'imine (päevade kaupa)
  • Grupeerimine ja agregeerimine

NumPy matemaatilised funktsioonid:

  • Trendide leidmine (lineaarne regressioon)
  • Korrelatsioonide arvutamine
  • Statistilised arvutused

Matplotlib ja Seaborn visualiseerimine:

  • Aegridade graafikud
  • Histogrammid ja jaotused
  • Scatter plot'id
  • Heatmap'id
  • Korrelatsioonimaatriksid

Ilmaandmete analüüs:

  • Temperatuuri, õhuniiskuse, tuule kiiruse ja atmosfääri rõhu muutuste jälgimine
  • Päevade kaupa statistika
  • Trendide ja korrelatsioonide leidmine
  • Andmete visualiseerimine ja eksportimine

Andmestik

Ilmaandmete näidisandmestik sisaldab:

  • 168 mõõtmist (7 päeva × 24 tundi)
  • Tunnise resolutsiooniga aegrida
  • 8 veergu: kuupäev, kellaaeg, temperatuur, õhuniiskus, tuule_kiirus, tuule_suund, atmosfääri_rõhk, sademed
  • Realistlikud andmed - temperatuur langeb öösel, tõuseb päeval, õhuniiskus on kõrge öösel
  • Arvutiteaduse instituut
  • Loodus- ja täppisteaduste valdkond
  • Tartu Ülikool
Tehniliste probleemide või küsimuste korral kirjuta:

Kursuse sisu ja korralduslike küsimustega pöörduge kursuse korraldajate poole.
Õppematerjalide varalised autoriõigused kuuluvad Tartu Ülikoolile. Õppematerjalide kasutamine on lubatud autoriõiguse seaduses ettenähtud teose vaba kasutamise eesmärkidel ja tingimustel. Õppematerjalide kasutamisel on kasutaja kohustatud viitama õppematerjalide autorile.
Õppematerjalide kasutamine muudel eesmärkidel on lubatud ainult Tartu Ülikooli eelneval kirjalikul nõusolekul.
Courses’i keskkonna kasutustingimused