Arvutiteaduse instituut
  1. Kursused
  2. 2022/23 kevad
  3. Andmetehnika mitteinformaatikutele (LTAT.02.026)
EN
Logi sisse

Andmetehnika mitteinformaatikutele 2022/23 kevad

  • Main
  • Lectures
  • Project
  • Homework
  • References
  1. Create dev container with VSCode: Utilize the 'Add Dev Container Configuration' command to set up a development container in Visual Studio Code, providing a consistent and reproducible development environment.
  2. Open ETL project or create a new one: Launch your existing ETL project within the dev container or start a new project to work with air quality data.
  3. Install Python packages: Install necessary Python packages, such as duckdb and pyarrow, to handle DuckDB and Parquet file operations.
  4. Write air quality data as Parquet file: Convert the air quality data into a Parquet file format for efficient storage and faster query performance.
  5. Query Parquet file using DuckDB in Python: Employ DuckDB to execute SQL queries on the Parquet file within a Python script, enabling seamless data processing and analysis.
  6. Install R packages and query Parquet file in R: Install the required R packages, such as dockdb and DBI, to interact with the Parquet file. Perform queries and analysis in R to showcase the flexibility of working with Parquet files across different programming languages.
  • Arvutiteaduse instituut
  • Loodus- ja täppisteaduste valdkond
  • Tartu Ülikool
Tehniliste probleemide või küsimuste korral kirjuta:

Kursuse sisu ja korralduslike küsimustega pöörduge kursuse korraldajate poole.
Õppematerjalide varalised autoriõigused kuuluvad Tartu Ülikoolile. Õppematerjalide kasutamine on lubatud autoriõiguse seaduses ettenähtud teose vaba kasutamise eesmärkidel ja tingimustel. Õppematerjalide kasutamisel on kasutaja kohustatud viitama õppematerjalide autorile.
Õppematerjalide kasutamine muudel eesmärkidel on lubatud ainult Tartu Ülikooli eelneval kirjalikul nõusolekul.
Courses’i keskkonna kasutustingimused