Arvutiteaduse instituut
  1. Kursused
  2. 2024/25 kevad
  3. Digitaalne maailmapilt (LTAT.00.020)
EN
Logi sisse

Digitaalne maailmapilt 2024/25 kevad

  • Pealeht
  • Loengud
    • L00 - sissejuhatus
    • L01 - bitt
    • L02 - progemine
    • L03 - algoritm
    • L04 - programmeerimiskeeled
    • L05 - pilt
    • L06 - andmestruktuur
    • L07 - tekst ja otsing
    • L08 - andmebaas
    • L09 - op-süsteem
    • L10 - arvutivõrk
    • L11 - tehisaru
    • L12 - optimeerimine
    • L13 - võrgustikud
    • L14 - infoturve
    • L15 - tarkvaratehnika
    • L16 - muutused
  • Kodutööd
    • Ülesanded
  • Hindamine
  • Zulip vestlustuba
  • Infokirjad
  • Lisamaterjalid
    • Jätkukursused
    • ChatGPT näiteid
  • Tagasiside

L07: Tekst, infootsingud, masintõlge - ekskurss

  • Slaidid L07 - PDF
  • Loengukonspekt: Dokument
  • Panopto - L07 - Tekst ja infootsing

Peamised teemad:

  • Tekst ja sümbolid
  • Unicode ja tähestikud
  • Infootsing (Information Retrieval)
  • Loomuliku keele töötlus (NLP)
  • Sagedused ja sõnade tähtsus
  • Täpsus ja saagis (Precision and Recall)
  • Regulaaravaldised
  • UNIX tööriistad: grep, sort, uniq
  • Anagrammid ja tekstianalüüs
  • Keele mudelid ja semantika
  • Meelsuse tuvastamine (Sentiment Analysis)
  • Masintõlge ja kõnesüntees

Täiendav info:

  • Tüpograafia ajalugu ja fondid
  • Kuidas lahendada ristsõnu? (Vt ka Wordle mängu lahendaja kirjeldus
  • Lisainfo: Näiteid tekstiressurssidest, UNIX käskudest, teksti töötlemisest
  • Keeletehnoloogia ressursid: Lisalinke materjalidele keele ja keele töötluse kohta
  • Crash course in Computer Science -- Natural Language Processing 
  • Õpik Speech and Language Processing (3rd ed. draft) Dan Jurafsky and James H. Martin
  • EKI sõnastikud - https://portaal.eki.ee/sonaraamatud.html
  • Keeleveeb sõnastikud jne - https://keeleveeb.ee/
  • Keeleressursid - https://keeleressursid.ee/et/keeleressursid
  • Projekt Gutenberg - https://www.gutenberg.org/

Tagasiside küsimustik: https://forms.gle/umTRrV7j9DTzYxqd6

  • Arvutiteaduse instituut
  • Loodus- ja täppisteaduste valdkond
  • Tartu Ülikool
Tehniliste probleemide või küsimuste korral kirjuta:

Kursuse sisu ja korralduslike küsimustega pöörduge kursuse korraldajate poole.
Õppematerjalide varalised autoriõigused kuuluvad Tartu Ülikoolile. Õppematerjalide kasutamine on lubatud autoriõiguse seaduses ettenähtud teose vaba kasutamise eesmärkidel ja tingimustel. Õppematerjalide kasutamisel on kasutaja kohustatud viitama õppematerjalide autorile.
Õppematerjalide kasutamine muudel eesmärkidel on lubatud ainult Tartu Ülikooli eelneval kirjalikul nõusolekul.
Courses’i keskkonna kasutustingimused