Arvutiteaduse instituut
  1. Kursused
  2. 2019/20 kevad
  3. Tehisintellekti Algkursus (LTAT.TK.013)
EN
Logi sisse

Tehisintellekti Algkursus 2019/20 kevad

Küsimuste ja/või probleemide korral kirjutage: ti@ut.ee

  • AVALEHT 2021
  • AVALEHT 2020
  • Kursuse korraldus 2020
  • 1. OSA. Sissejuhatus tehisintellekti
  • 2. OSA. Masinõpe
  • 3. OSA. Masinnägemine
  • 4. OSA. Isejuhtivad autod
  • 5. OSA. Keeletehnoloogia
  • 6. OSA. Ärianalüütika

6.1 Sissejuhatus
6.2 Kliendi eluaja tsükkel
6.3 Klientide segmenteerimine
6.4 Kliendi eluaegne väärtus ja kliendi omandamiskulu
6.5 Klientide lahkumise ennustamine
6.6 Rist- ja ülesmüük
6.7 Kokkuvõte
6.8 Praktiline näide ja test

  • 7. OSA. Inimese ja roboti interaktsioon
  • 8. OSA. Tehismõistus meditsiinis
  • Viited ja kirjandus
< eelmine6. OSA sisukordjärgmine >

6.1 Sissejuhatus ärianalüütikasse autorid: Anna Leontjeva ja Rajesh Sharma

Aastal 2013 avaldati uurimus, mis ütles, et peaaegu 90% kogu maailmas eksisteerivatest andmetest oli salvestatud viimase kahe aasta jooksul. Sarnane andmete järjest kiirenev kogumine ja talletamine on jätkunud. Pidevalt lisandub uusi teenusepakkujaid, veebiplatforme ja seadmeid, mis inimestele paremate teenuste pakkumiseks nende kohta infot salvestavad. Olemasolevate andmete tohutu hulk on sundinud ettevõtteid ja eriti just nende turundustiime rakendama andmeteaduse meetodeid, et neis suurtes andmekogustes sisalduvat infot mõista. Andmetest õiget infot kätte saades on võimalik luua uut väärtust. Siiski, paljudel juhtudel firmad omavad andmeid, aga ei suuda neist mingit väärtust genereerida, peamiselt, sest puuduvad töötajad, kes oleksid kursis olemasolevate andmekaeve meetodite ja saadaval olevate andmeteaduse tööriistadega. Äriandmete analüütika valdkond tegelebki suurte andmehulkade analüüsiga erinevate andmeteaduse meetoditega, et mõista nii trende turgude ja klientide käitumises kui ka ennustada ja prognoosida klientide käitumist eesmärgiga pakkuda klientidele paremat teenust.

'''Definitsioon: Ärianalüütika: iteratiivsete meetodite rakendamine, mis informeerivad või aitavad teha otsuseid, et saavutada või maksimeerida mingit ärilist eesmärki. '''

Joonis 1. Ärianalüütika abiga otsuste vastuvõtmise protsessi kirjeldus.

Joonisel 1 on kujutatud üldine vooskeem, mida kasutatakse ärianalüütikas. Pärast andmete kogumist ja eeltöötlust (näiteks puhastamist, üks-mitmest kujule panekut jne) rakendatakse neile sobivat mudelit ja mudeli väljundid aitavad ettevõttel teha paremaid otsuseid. Esimene väga oluline samm selles protsessis on andmete esmane uurimine ja visualiseerimine. On oluline teada, kuidas andmed jaotunud on, mis on erinevate väärtuste keskmised ja kui variatiivsed saadud väärtused on. Selle kõige paremaks tajumiseks kasutatakse jooniseid ja graafikuid. Samuti võib väga oluliseks sammuks osutuda andmete puhastamine - mingid andmed võivad olla valesti sisestatud või puudu. Enne, kui andmetele saab mudeleid rakendada, tuleb vigased andmed eemaldada või mingil viisil korda teha.

Üldiselt saab andmeanalüüsi meetodeid jaotada eesmärgi alusel kolme gruppi (vt. Joonis 2):

Joonis 2. a) Kirjeldav ärianalüütika b) Ennustav ärianalüütika c) Normatiivne ärianalüütika

Kirjeldav analüütika vastab küsimusele: mis juhtus? Näiteks, millised on enimmüüdud tooted meie ettevõttes? Milline on vanusejaotus meie klientide seas?

Ennustav analüütika vastab küsimusele: mis juhtub tulevikus? Näiteks, kes meie klientidest suure tõenäosusega loobub meie teenustest? Mis on järgmise aasta oodatav tulu?

Normatiivne analüütika vastab küsimusele: Mida teha, et mõjutada tulevikku? Näiteks, pakkudes teatud kliendisegmendile soodustust, saame me suurendada tulu, vähendades klientide lahkumise protsenti.

Äriandmete statistiliste meetoditega uurimisel on mitmeid rakendusjuhte, näiteks:

  • Klientide segmenteerimine. Ettevõte on huvitatud oma klientide grupeerimisest erinevatesse “segmentidesse”. Grupeerimise aluseks võib olla näiteks see, millal ja kui palju tulu need kliendid firmale toonud on, aga võib ka olla näiteks nende vanus, sugu või muud tunnused. Mõned segmenteerimismeetodid nõuavad eksperthinnanguid, aga andmekaevel põhinevad lähenemised lubavad automaatset grupeerimist. Meetoditena võib välja tuua klasterdamise ja HSV (hiljutisus, sagedus, väärtus) analüüsi (ingl RFM: recency, frequency, monetary value))
  • Kliendi eluaegne väärtus. Ettevõte soovib ennustada, kui palju tulu klient kokku toob kogu oma suhte jooksul ettevõttega. Selline teadmine võimaldab suunata suhtlust klientidega ja keskenduda tulusamatele klientidele. Sellisel juhul on kasulikeks meetoditeks regressioonimeetodid, sest selles ülesandes peab ennustama tulu, mis on pidev, arvuline väärtus.
  • Klientide lahkumine. Ettevõtted on väga huvitatud võimest ennustada, millised kliendid tõenäoselt lahkuvad, sest see võimaldab sekkuda ning potentsiaalselt olukorda parandada. Tegu on klassifikatsiooniprobleemiga, sest selles ülesandes peab ennustama kliendi otsust (kas klient lahkub või mitte).
  • Rist- ja ülesmüük. Ettevõte saab maksimeerida oma kasumit, kui suudab ennustada klientide ostusoove ja pakkuda seda, mida neil on parajasti vaja. Tegu on soovitussüsteemi treenimise ülesandega.

< eelmine6. OSA sisukordjärgmine >
Materjalide kasutamise kohta konsulteerige palun Korduma kippuvad küsimused sektsioonis.
  • Arvutiteaduse instituut
  • Loodus- ja täppisteaduste valdkond
  • Tartu Ülikool
Tehniliste probleemide või küsimuste korral kirjuta:

Kursuse sisu ja korralduslike küsimustega pöörduge kursuse korraldajate poole.
Õppematerjalide varalised autoriõigused kuuluvad Tartu Ülikoolile. Õppematerjalide kasutamine on lubatud autoriõiguse seaduses ettenähtud teose vaba kasutamise eesmärkidel ja tingimustel. Õppematerjalide kasutamisel on kasutaja kohustatud viitama õppematerjalide autorile.
Õppematerjalide kasutamine muudel eesmärkidel on lubatud ainult Tartu Ülikooli eelneval kirjalikul nõusolekul.
Tartu Ülikooli arvutiteaduse instituudi kursuste läbiviimist toetavad järgmised programmid:
euroopa sotsiaalfondi logo