< eelmine | 6. OSA sisukord | järgmine > |
6.4 Kliendi eluaegne väärtus ja kliendi omandamiskulu
autor: Anna Leontjeva
Kliendi eluaegne väärtus (KEV) (ingl customer lifetime value or CLV) ja kliendi omandamiskulu (KOK) (ingl customer acquisition cost or CAC) on kaks näitajat, mida peetakse väga oluliseks ettevõtte tegevuse planeerimisel. Nende näitajate sisu on väga lihtne:
KOK näitab kogukulu, mis on kulutatud kliendi soetamiseks. KOK meetrika peab kajastama kliendi omandamisega seotud kulusid kõigi turundustegevuste jaoks, sealhulgas internetipõhiseid ja väljaspool internetti toimuvaid kampaaniaid, stendide ja meediumite paigutuste kulusid, Google'i ja Facebooki reklaamide kulusid, tasuta prooviversioone (nt. Netflixi puhul) ja isegi vitriini kaunistamise kulusid (vt. Joonis 19).
Joonis 19. Kliendi omandamiskulude valemi illustratsioon.
KEV näitab kogutulu mida klient genereeris terve perioodi jooksul, mil klient oli aktiivne. On olemas palju valemeid KEV arvutamiseks, kuid nende põhimõte jääb samaks. Joonis 20 näitab ühte KEV arvutuskäiku, teiste versioonidega saab tutvuda lingil: https://blog.kissmetrics.com/wp-content/uploads/2011/08/calculating-ltv.pdf.
Joonis 20. Kliendi eluaegse väärtuse valemi illustratsioon.
Täpselt arvutatud KEV on võimalik alles siis, kui kliendisuhe on juba lõppenud, ehk klient on juba lahkunud (näiteks, ta tühistab oma igakuise tellimuse või lepingu). Sellist KEV nimetatakse ajalooliseks. Kuid ajaloolisest kliendi eluaegsest väärtusest on tihti vähe kasu, sest tahetakse teada tulevase või olemasoleva kliendi KEV-d ehk kliendi oodatavat eluaegset väärtust (OKEV). Selleks on meil vaja hinnata, milline oleks tulevaste või olemasolevate klientide KEV, kasutades selleks endiste klientide KEV-d. Selle tegevuskäiku illustreerime peatüki lõpus.
KEV ja KOK on mõistlikud kui neid mõlemaid võetakse arvesse ja võrreldatakse. Tihti kasutatakse ka KEV:KOK suhet, mis on tõhus analüütiline tööriist müügi- ja turunduslehtri efektiivsuse mõõtmiseks. Selle analüüsi nurgakiviks on järgmine küsimus: “kas klient on väärt rohkem (KEV) kui see, kui palju maksab võimalus sellele kliendile midagi müüa (KOK)?”. Vastates sellele küsimusele, saab ettevõtte juhatus planeerida oma tulevikku ja jaotada ressursse vastavalt. Kui KEV:KOK suhe on ligikaudselt 1, siis firma kulutab sama palju raha klientide meelitamiseks kui saab nendest kasumit. See ei tasu pikas perspektiivis ära. Kui suhe on väiksem kui 1, siis tegu on ettevõttega, mis kaotab raha. Loogiline on, et ettevõte saab kasumit kui see suhe on suurem kui 1. Samas, tasub meeles pidada, et väga kõrge suhe pole samuti hea, kuna võib tähendada, et ettevõte ei laiene või ei pruugi uusi kliente meelitada.
Allpool toodud kontseptsioonide illustreerimiseks toome lihtsustatud näite. Oletame, et tegu on e-poega, mis tegeleb mahetoodete müügiga. Selle ettevõtte reklaamikulu eelmisel kuul oli 10 000€, ja oletame, et need ongi ainsad turundusega seotud kulud. Tellijate seas olid 200 klienti sellel kuul uued. KOK seega oleks ligikaudselt 50€ iga kliendi kohta. Eeldame, et keskmiselt meie tulu iga ostu kohta on 3.50€ ja keskmine ostude sagedus on 4 tellimust kuus. Mahetoodete kasumimarginaal on 25% (kasumimarginaal näitab, kui suur osa igast teenitud eurost jääb ettevõttele alles). Keskmiseks kliendi elueaks arvestame selles näites 2 aastaga (kuna arvutame kuiseid numbreid siis 2x12). Seega, KEV = (3.50*4*0.25)*24 = 84€. Seega, KEV:KOK suhe on 84/50 = 1.68, mis näitab, et ettevõte jaotab oma ressursid õigesti ja suudab olla kasumlik.
Osa komponentidest KEV ja KOK arvutuses on keskmistatud, mis ilmtingimata viib selleni, et tegelik väärtus võib sellest hinnangust oluliselt erineda. KEVi ja KOKi saab täpsemalt hinnata, kui arvutada need iga kliendisegmendi kohta eraldi. Võib loogiliselt arvata, et kõrge väärtusega klientide KEV erineb potentsiaalsetest ja madala väärtusega klientide KEVist. Segmendi KEVi arvutus erineb, kuna keskmistame väärtusi segmentide lõikes.
Nagu eelnevalt mainisime, OKEV üritab hinnata tulevast KEVi väärtust ning see võimaldab hinnata neid väärtusi veelgi täpsemalt, võttes arvesse tulevikus toimuvaid faktoreid. Näiteks, kasutades lihtsustatud KEV arvutamist ei arvesta me sesoonsusega (pühade ajal võib klientide käitumine oluliselt erineda). Vaatleme siin kahte viisi, kuidas saame hinnata OKEV-d.
Esimeses lähenemisviisis me keskendume sellele, et teha ennustusi kasutades aegridade analüüsi. Aegridade analüüs hõlmab aegrea andmete analüüsimeetodeid, kus tulevaste väärtuste ennustamiseks koostatakse mudel eelnevalt vaadeldud väärtuste põhjal. Antud rakenduses me prognoosime kliendiga seotud tulevasi väärtusi kasutades varasemalt kogutud infot selle kliendi kohta. Aegridade analüüsi saab rakendada nii kliendi tasemel kui ka segmendi tasemel.
Teise lähenemisviisi puhul saab kasutada infot nendest klientidest, kelle kohta on andmed (ja märgend, KEV) olemas, et treenida nende andmete peal masinõppe mudel. Seejärel saab ennustada nende klientide väärtusi, kelle kohta on andmeid veel vähe (nt uued kliendid). Selleks saame kasutada varasemates moodulites käsitletud juhendatud õpet (vt. Joonis 21).
Joonis 21. Illustratiivne näide lähenemisviisidest. Vasak: ühe aegrea prognoos, Parem: juhendatud masinõpe mudel.
Kirjeldame siin neid kahte lähenemisviisi, kasutades sama andmestikku, mida analüüsisime Peatükis 6.3.
Aegrea analüüs
Tuletame meelde, et me klasterdasime näidisandmestikku, kus tulemuseks on kolm segmenti: “potentsiaalsed”, “väärtuslikud” ning “madala väärtusega” klastrid. Oletame ka, et meie ettevõtte kasumimarginaaliks on 20%. Praktilistes materjalides näitame, kuidas me arvutame KEV väärtused, hetkel aga näitame, et tulemuseks on selline tabel (esimest 5 rida):
Joonis 22.
Tabeli kaks esimest veergu näitavad kliendi id-d ning kuud ja aastat. Sagedus ja väärtus on arvutatud iga kliendi jaoks selle kuu jooksul. Klastri info on saadud meie k-keskmisest klasterdamisest. Eluaeg on arvutatud kui kuude arv esimese ja viimase tehingu vahel. KEV on arvutatud kasutades valemit Joonisel 20 (korrutame sagedus*väärtus*eluaeg*kasumimarginaal).
Nüüd me saame keskmistada klientide info iga segmendi kohta eraldi ja visualiseerida nende aegridu. Näiteks, iga segmendi keskmistatud KEV ajas on visualiseeritud Joonisel 23.
Joonis 23. Aegread iga segmendi puhul eraldi, kus on näidatud kuised keskmised KEV väärtused iga kliendi kohta. Pane tähele, et madala väärtusega klientide gruppi kuuluvad sellised kliendid, kellel on viimase kolme aasta jooksul KEV null. Huvitaval moel iga segmendi puhul KEV järgib valdavalt negatiivset trendi.
Prognoosimiseks saame kasutada selliseid mudeleid nagu ARIMA, et prognoosida huvialused tulevased väärtused. Näiteks, Joonis 24 näitab “väärtuslike klientide” segmendi keskmist ostusummat ja selle prognoosi (alates 2019).
Joonis 24. Prognoositud väärtused ARIMA mudeliga “väärtuslike klientide” segmendi jaoks. Musta värviga punktid on individuaalsed väärtused. Sinine joon on mudeli ennustus. Helesinine ala on mudeli 95% usaldusvahemik.
Sarnaselt, saame prognoosida KEV teiste klastrite puhul. Selline KEVi prognoos ehk OKEV on kasulik, et pikaajaliselt planeerida ettevõtte turundus- ja müügieelarvet.
Miinused: Peab arvestama sellega, et antud juhul me kasutame ainult ajaloolist infot KEVi kohta ja ei võtta arvesse teisi faktoreid.
Juhendatud õpe. Regressiooni mudel.
Teine lähenemisviis lubab arvesse võtta klientide iseloomustusi, mitte ainult ajaloolist infot. Oletame, et tegu on e-kaubanduse ettevõttega, ning iga kliendi kohta on meil antud ka nende käitumine selle ettevõte veebilehel. Näiteks, taolist infot saab hankida kasutades Google Analytics platformi. Lisaks, on teada kliendi sugu ja vanus, sest tegu on veebilehel registreeritud klientidega (vt. Tabel/Joonis 25). Lisaks, me eeldame, et andmestik on filtreeritud nii, et see sisaldaks ainult neid kliente, kes ei ole enam aktiivsed. Seega saame usaldusväärselt hinnata nende eluiga ja KEVi.
Joonis 25. Esimesed 5 rida andmestikust, kus on olemas tunnused klientide kohta.
Oodatava kliendi eluaegse väärtuse ennustamise eesmärk on aimata seost iga kliendi tunnuste ja KEVi vahel. Juhendatud õppe mudeli alusprintsiibiks on “sarnaste tunnustega klientide käitumine on samuti sarnane”. Kui mudel on hea, siis saab seda kasutada teiste, uute või aktiivsete, klientide puhul. Kuna KEVi väärtus on pidev tunnus, on tegu regressiooniülesandega. Näite lihtsustamiseks me hetkel ei käsitle analüüsi iga segmendi puhul eraldi (kus mudel treenitakse iga segmendi puhul eraldi).
Joonis 26. Paarisdiagramm andmestiku tunnustest on kiire viis, kuidas visuaalselt hinnata tunnuste võimalikke seoseid. See diagramm koosneb hajuvusdiagrammidest iga arvuliste väärtustega tunnusepaari vahel ning iga tunnuse jaotust kirjeldavatest histogrammidest. Histogrammid võimaldavad mõista iga tunnust eraldi ning hajuvusdiagrammidelt on näha, kas mingid tunnused korreleeruvad omavahel. Sugu ei ole mõistlik sellisel viisil visualiseerida, sest see on binaarne (kategooriline) tunnus.
Vaatleme esiteks meie valitud klientide tunnuseid (Joonis 26). Mida tasub jälgida, on tunnuste jaotus ning seosed tunnuste vahel. Antud juhul me võime joonistelt kohe näha, et vanus ja ettevõtte veebilehel tehtud hiireklõpsude arv on mõõdukalt head sisendtunnused KEVi ennustamiseks, sest need on keskmise eluaegse väärtusega umbkaudselt lineaarselt korreleeritud (vt teise rea esimene ja kolmanda rea teine graafik joonisel 26: hajuvuspilved on jaotatud diagonaali ümber). Regressioonimudeli tüübina kasutame lineaarset regressiooni (see on üks paljudest võimalikest mudelitüübidest, vt. ka selliseid mudeleid nagu regressiooni juhumets, tugivektormasinad, tehisnärvivõrgud jne). Lineaarse mudeli kuju saame lahti kirjutada kui:
Pane tähele, et me kasutame “~”, mis tähendab “ligikaudselt võrdne”, teisisõnu, see on hinnang -- me hindame KEV nende parameetrite abil, kuid vastused ei ole alati täpselt võrdsed KEVi väärtusega.
KEV on sõltuv tunnus (eelnevates loengutes märgend, ennustatav tunnus), hiireklõpsude arv, vanus ja sugu on sõltumatud tunnused. w-ga on tähistatud regressioonikordajad (mida nimetatakse ka kaaludeks), mida vaja algoritmi abil hinnata. Selleks, et ennustada klientide eluaja väärtusi, on vaja teostada järgmised sammud:
- jagada andmestik juhuslikult treenimisandmestikuks ja valideerimisandmestikuks. Seda tehakse selleks, et sobitada mudelit treenimisandmestiku näidete abil, minimeerides viga, ja valideerida siis saadud treenitud mudelit valideerimisandmestiku peal, kus me saame reaalselt mõõta mudeli tehtud vea. Nii treenimis- kui valideerimisandmestikus sisaldub ka märgend, informatsioon KEVist, ehk sõltuva tunnuse tõene väärtus, millega võrdleme meie ennustusi. Meie näidisülesandes jagame andmestiku täpselt pooleks, seega, treenimisandmestikus on meil 500 klienti ja sama palju ka valideerimisandmestikus.
- treenida mudel kasutades treenimisandmestikku. Treenitud mudelit rakendatakse seejärel valideerimisandmestikule ning arvutatakse mudeli headuse ja täpsuse näitajad. Regressiooni puhul kasutatakse tihti selliseid näitajaid nagu keskmist absoluutviga, keskmist ruutviga või determinatsioonikordajat r2, mida kirjeldame allpool. Antud mudeli headuse mõõdikud aitavad hinnata, kui hästi mudel ennustab. Kui näitajad ei ole piisavalt head, treenitakse mudel uuesti, kasutades kas rohkem või teistsuguseid tunnuseid, rohkem või teistsuguseid andmeid, või hoopis teistsugust mudelitüüpi.
- kui mudel üldistub valideerimisandmestikule piisavalt hästi, saame kasutada mudelit nö päriselus, kus me ei tea õigeid vastuseid. Sellise mudeli abil saame hinnata ka veel aktiivsete või hoopis uuete klientide KEVi.
Kui oleme treeninud mudeli kasutades treenimisandmestikku, saame mudeli, mille tulemusi valideerimisandmestiku peal illustreerib Joonis 27.
Joonis 27. Mudeli tulemused valideerimisandmestiku peal. x-teljel on tegelikud KEV väärtused valideerimisandmestiku peal ja y-teljel on mudeli poolt ennustatud KEV.
Kõigepealt saame vaadata kui hästi ennustatud väärtused on kooskõlas reaalse KEV väärtustega. Hajuvusdiagramm näitab punktide pilve, kus iga punkt on klient, ning horisontaalteljel on tõeline KEV ja y-teljel mudeli poolt ennustatud KEV. Kui mudel oleks täiuslik, oleksid kõik punktid täpselt diagonaalil (punasel joonel), sest iga KEV väärtus ja mudeli ennustus selle kliendi kohta oleksid identsed. Determinatsioonikordaja r2 näitab kui suur on mudeli poolt tehtud viga võrreldes veaga, mis on arvutatud kasutades kõikide klientide puhul ennustusena ostusummade keskmist väärtust:
Mida lähem r2 1-le on seda parem on mudel. Antud juhul r2 on 0.71, seega me võime öelda, et mudel on suhteliselt hea. Samas Jooniselt 27 me näeme, et mudel ei suuda hästi ennustada suuri KEVi väärtusi (punasest joonest allpool). Kas mudel on piisavalt hea, saab otsustada võttes arvesse ärinõudmisi. Antud juhul tundub, et mudelit saaks parandada lisades andmestikku juurde mingeid teisi kliente kirjeldavaid tunnuseid. Muuhulgas saab jooniselt 27 ka välja lugeda mudeli täpse kuju, sest mudeli kordajad (w-ga tähistatud kaalud/kordajad) ja vabaliige on seal etteantud. Seega meie treenitud mudel on:
Regressiooni korral näitavad regressioonikordajad, millisel määral iga sõltumatu tunnus mõjutab sõltuvat muutujat eeldusel, et teised sõltumatud tunnused samal ajal ei muutu. See tähendab, et kui meil on tekkinud uus klient, kes on mees, kes tegi 10 hiireklõpsu, ning kes on 20 aastat vana, siis selle mudeli järgi tema KEV oleks: -10.23 + 4.13*10 + 38.9*0 + 0.24*20 = 35.87. Pane ka tähele, et soo asemel meil on 0, kuna mees on kodeeritud nulliks ja naine üheks. Seega, saame seda interpreteerida nii, et naiste KEV on keskmiselt 38.9 võrra kõrgem kui meeste oma eeldusel, et teised tunnused samal ajal ei muutu.
Juhendatud õppe meetodid on väga tõhusad meetodid, kuid siinkohal tuleb meeles pidada, et mudel saab olla ainult nii hea, kui head on andmed. Enne mudelit looma asumist tasub mõelda, millised sõltumatud tunnused võiksid üldse sisaldada infot sõltuva tunnuse (märgendi, meie näites KEV) väärtuse kohta ja mil määral. Tehniliselt saab üritada treenida mudeli, kasutades juhuslikke tunnuseid, mis polegi seotud sellega, mida tahame ennustada. Ilmselgelt poleks tulemuseks hea ennustustäpsus. Seega on ka ärivaldkonnas tihti vaja ette planeerida, milliseid kliendiandmeid küsida ja salvestada.
< eelmine | 6. OSA sisukord | järgmine > |