2025 vastuvõetute infomaterjalid
3.-4. september (kolmapäev-neljapäev) kell 16:15 - 18:00
Delta ruum 1008
Väike sissejuhatus andmeteaduse II kursuse tudengitelt. Palun võtta kaasa koolitööks kasutatav sülearvuti!
3. september 2025 -- töömasina seadistamine
Sisukord
- Käsurea põhitõed
- Pythoni paigaldamine
- Git-i seadistamine
- GitHub/GitLab Konto
- Conda Keskkonnad
- IDE Valik
- Probleemide Lahendamine
See juhendmaterjal aitab teil seadistada oma arvuti koolitööks.
1. Käsurea Põhitõed
Mis on käsurida?
Käsurida (Command Line Interface - CLI) on tekstipõhine viis arvutiga suhtlemiseks.
Käsurea avamine Windows-is
- Command Prompt (cmd):
-> Vajutage Win + R
, kirjutage "cmd" ja vajutage Enter
-> Või otsige "Command Prompt" Start menüüst (või lihtsalt "cmd")
Peamised käsurea käsud
Kaustade navigeerimine
- Vaata, kus sa oled
pwd
- Vaata kaustade sisu
dir
- Liigu kausta
cd kausta_nimi
- Liigu ühe taseme võrra üles
cd ..
- Liigu kodukausta
cd ~
- Liigu C: kettale
cd C:\
Kaustade ja failide loomine
- Loo uus kaust
mkdir uus_kaust
- Loo uus fail
echo "Sisu" > uus_fail.txt
- Loo mitu kausta korraga
mkdir kaust1 kaust2 kaust3
Python käivitamine
- Käivita Python
python
- Käivita Python skript
python minu_skript.py
- Kontrolli Python versiooni
python --version
2. Tarkvara Allalaadimine ja Paigaldamine
Python
- Mine veebilehele: https://www.python.org/downloads/
- Laadi alla uusim versioon (3.12 või uuem)
- Paigalda - OLULINE: Märkige "Add Python to PATH"
- Kontrolli paigaldust:
python --version
pip --version
Git
- Mine veebilehele: https://git-scm.com/download/win
- Laadi alla ja paigalda
- Kontrolli paigaldust:
git --version
- Seadista Git:
git config --global user.name "Teie Nimi"
git config --global user.email "teie.email@example.com"
Anaconda
- Mine veebilehele: https://www.anaconda.com/download
- Laadi alla Anaconda Individual Edition
- Paigalda - valige "Add Anaconda to PATH"
- Kontrolli paigaldust:
conda --version
IDE-d (Integreeritud Arenduskeskkonnad)
Visual Studio Code
- Mine veebilehele: https://code.visualstudio.com/
- Laadi alla ja paigalda
- Soovitatavad laiendused:
-> Python -> GitLens -> Jupyter
PyCharm Community Edition
- Mine veebilehele: https://www.jetbrains.com/pycharm/download/
- Laadi alla Community Edition (tasuta)
- Paigalda
Cursor
- Mine veebilehele: https://cursor.sh/
- Laadi alla ja paigalda
- AI-põhine koodiredaktor
3. Git ja GitHub
Mis on Git?
Git on versioonihaldussüsteem, mis aitab jälgida failide muudatusi ja töötada koos teistega.
GitHub konto loomine
- Mine veebilehele: https://github.com
- Loo tasuta konto
- Kinnita e-mail
Git põhitoimingud
Projekti loomine
- Loo uus kaust projekti jaoks
mkdir minu_projekt
cd minu_projekt
- Initsialiseeri Git repositoorium
git init
- Loo README fail
echo "# Minu Projekt" > README.md
- Lisa failid Git-ile
git add .
- Tee esimene commit
git commit -m "Esimene commit"
GitHub-iga ühendamine
- Lisa GitHub repositoorium
git remote add origin https://github.com/teie-kasutajanimi/minu-projekt.git
- Saada kood GitHub-isse
git push -u origin main
Projekti kloonimine
- Klooni olemasolev projekt
git clone https://github.com/teie-kasutajanimi/projekt.git
- Liigu projekti kausta
cd projekt
Töövoog (Workflow)
- Vaata failide staatust
git status
- Lisa muudatused
git add faili_nimi.py
- või kõik failid
git add .
- Tee commit
git commit -m "Kirjeldus muudatustest"
- Saada GitHub-isse
git push
Uuenduste laadimine
- Laadi uuendused GitHub-ist
git pull
Branchimine (Harude loomine)
- Vaata olemasolevaid harusid
git branch
- Loo uus haru
git branch uus_funktsioon
- Liigu uuele harule
git checkout uus_funktsioon
- või uuemal Git-il
git switch uus_funktsioon
- Tee muudatused ja commit
git add .
git commit -m "Uus funktsioon lisatud"
- Saada haru GitHub-isse
git push -u origin uus_funktsioon
Pull Request
- Mine GitHub-i
- Klõpsa "Compare & pull request"
- Lisa kirjeldus
- Saada pull request
4. Conda Keskkonnad
Mis on Conda?
Conda on paketihaldur ja keskkonna haldur Python-i jaoks. See aitab hallata erinevaid Python versioone ja teeke.
Miks on üks keskkond halb?
Probleemid ühe keskkonnaga:
- Versioonikonfliktid: Erinevad projektid vajavad erinevaid teekide versioone
- Süsteemi segamine: Paigaldatud teegid võivad mõjutada teisi projekte
- Raskendatud koostöö: Teised ei saa reprodutseerida teie keskkonda
- Uuenduste risk: Uuendused võivad rikkuda vanu projekte
Conda keskkondade loomine
Uue keskkonna loomine
- Loo uus keskkond Python 3.11-ga
conda create -n andmeteadus python=3.11
- Aktiveeri keskkond
conda activate andmeteadus
- Paigalda teegid
conda install numpy pandas matplotlib jupyter
- Või kasuta pip-i
pip install numpy pandas matplotlib jupyter
Keskkondade haldamine
- Vaata kõiki keskkondi
conda env list
- Aktiveeri keskkond
conda activate andmeteadus
- Deaktiveeri keskkond
conda deactivate
- Kustuta keskkond
conda env remove -n andmeteadus
Keskkonna eksportimine
- Ekspordi keskkond faili
conda env export > environment.yml
- Loo keskkond failist
conda env create -f environment.yml
Soovitatud töövoog
- Iga projekti jaoks
mkdir uus_projekt
cd uus_projekt
- Loo uus keskkond
conda create -n projekt_nimi python=3.11
- Aktiveeri keskkond
conda activate projekt_nimi
- Paigalda vajalikud teegid
conda install numpy pandas matplotlib
- Alusta tööd
jupyter notebook
5. Praktilised Näited
Täielik projekti seadistamine
- 1. Loo projektikaust
mkdir minu_andmeteaduse_projekt
cd minu_andmeteaduse_projekt
- 2. Initsialiseeri Git
git init
echo "# Minu Andmeteaduse Projekt" > README.md
- 3. Loo Conda keskkond
conda create -n minu_projekt python=3.11
conda activate minu_projekt
- 4. Paigalda teegid
conda install numpy pandas matplotlib jupyter
- 5. Loo esimene Python fail
@@echo "import pandas as pd import numpy as np print('Tere, andmeteadus!')" > minu_skript.py@@
- 6. Git commit
git add .
git commit -m "Esimene andmeteaduse projekt"
- 7. Ühenda GitHub-iga
git remote add origin https://github.com/teie-kasutajanimi/minu-projekt.git
git push -u origin main
Jupyter Notebook käivitamine
- Aktiveeri keskkond
conda activate minu_projekt
- Käivita Jupyter
jupyter notebook
- Või JupyterLab
jupyter lab
6. Kasulikud Käsud ja Näpunäited
Kiired käsud
- Vaata käsurea ajalugu
history
- Otsi faili
dir /s faili_nimi.txt
- Kopeeri fail
copy fail1.txt fail2.txt
- Liiguta fail
move fail1.txt kaust/
- Kustuta fail
del faili_nimi.txt
- Kustuta kaust
rmdir kausta_nimi
Git kiirkäsud
- Vaata muudatusi
git diff
- Vaata commit ajalugu
git log --oneline
- Tühjenda staged failid
git reset
- Tühjenda kõik muudatused
git checkout -- .
Conda kiirkäsud
- Paigalda mitu teeki korraga
conda install numpy pandas matplotlib seaborn
- Uuenda kõik teegid
conda update --all
- Otsi teeki
conda search numpy
7. Probleemide Lahendamine
Levinud probleemid
"Python ei ole leitud"
- Kontrollige, kas Python on PATH-is
- Taaskäivitage käsurea aken
- Paigalda Python uuesti "Add to PATH" valikuga
"Git ei ole leitud"
- Kontrollige Git paigaldust
- Taaskäivitage käsurea aken
"Conda ei ole leitud"
- Kontrollige Anaconda paigaldust
- Kasutage Anaconda Prompt-i
Git autentimise probleemid
- Seadista Git credential helper
git config --global credential.helper manager-core
8. Järgmised Sammud
Kasulikud ressursid
- Git dokumentatsioon: https://git-scm.com/doc
- Python dokumentatsioon: https://docs.python.org/
- Pandas dokumentatsioon: https://pandas.pydata.org/docs/
- Conda dokumentatsioon: https://docs.conda.io/
4. september 2025 -- programmeerimine ja peamised paketid Pythonis
Palun alustuseks installeerida Anaconda https://www.anaconda.com/docs/getting-started/anaconda/install#windows-installation
Ilmaandmete Analüüs - Aegridade Töötlemine
Materjalid
Kõik vajalikud failid on saadaval GitHub repositooriumist: https://github.com/mrpae/andmeteadus-sissejuhatus2025
- Peamised failid:**
- ilmaandmete_analüüs.ipynb - Jupyter notebook ilmaandmete analüüsiga
- ilmaandmed_näidis.csv - Ilmaandmete näidisandmestik (168 mõõtmist)
- environment.yml - Conda keskkonna seadistus
- requirements.txt - Python teekide nimekiri
Keskkonna seadistamine
Enne notebook'i käivitamist loo conda keskkond:
- Loo uus conda keskkond Python 3.13-ga
conda create -n andmeteadus python=3.13
- Aktiveeri keskkond
conda activate andmeteadus
- Paigalda teegid requirements.txt failist
pip install -r requirements.txt
- Kontrolli paigaldust
python -c "import pandas, numpy, matplotlib; print('Kõik teegid on paigaldatud!')"
- Või kasuta environment.yml faili:
conda env create -f environment.yml
conda activate andmeteadus
Notebook'i sisu
1. Andmete laadimine ja ettevalmistamine
- Ilmaandmete laadimine CSV failist
- DateTime indeksi loomine
- Andmete puhastamine ja kontrollimine
2. Aegridade visualiseerimine
- Temperatuuri, õhuniiskuse, tuule kiiruse ja atmosfääri rõhu aegridad
- Seaborn heatmap korrelatsioonimaatriksiga
- Histogrammid ja jaotused
3. Aegridade analüüs
- Päevade kaupa statistika
- Trendide leidmine (lineaarne regressioon)
- Korrelatsioonide analüüs
4. Statistilised analüüsid
- Põhistatistika (min, max, keskmine, standardhälve)
- Korrelatsioonide arvutamine
- Scatter plot'id seoste visualiseerimiseks
5. Iseseisvad ülesanded
Notebook sisaldab 4 iseseisvat ülesannet:
- Ülesanne 1: Temperatuuri ekstreemumid - Leia kõige kõrgem/madalaim temperatuur
- Ülesanne 2: Tuule analüüs - Analüüsi tuule suundade ja kiiruse jaotust
- Ülesanne 3: Päevade võrdlus - Võrdle erinevaid päevi omavahel
- Ülesanne 4: Andmete eksportimine - Loo kokkuvõtte ja salvesta tulemused
Õpitud oskused
Pandas aegridade töötlemine:
- Andmete laadimine CSV failist
- DateTime indeksi loomine
- Aegridade resample'imine (päevade kaupa)
- Grupeerimine ja agregeerimine
NumPy matemaatilised funktsioonid:
- Trendide leidmine (lineaarne regressioon)
- Korrelatsioonide arvutamine
- Statistilised arvutused
Matplotlib ja Seaborn visualiseerimine:
- Aegridade graafikud
- Histogrammid ja jaotused
- Scatter plot'id
- Heatmap'id
- Korrelatsioonimaatriksid
Ilmaandmete analüüs:
- Temperatuuri, õhuniiskuse, tuule kiiruse ja atmosfääri rõhu muutuste jälgimine
- Päevade kaupa statistika
- Trendide ja korrelatsioonide leidmine
- Andmete visualiseerimine ja eksportimine
Andmestik
Ilmaandmete näidisandmestik sisaldab:
- 168 mõõtmist (7 päeva × 24 tundi)
- Tunnise resolutsiooniga aegrida
- 8 veergu: kuupäev, kellaaeg, temperatuur, õhuniiskus, tuule_kiirus, tuule_suund, atmosfääri_rõhk, sademed
- Realistlikud andmed - temperatuur langeb öösel, tõuseb päeval, õhuniiskus on kõrge öösel