< eelmine | 8. OSA sisukord | järgmine > |
8.5 Probleemid terviseandmete uurimisel
autorid: Raivo Kolde, Sulev Reisberg
Olgugi, et käesolevas loengus kirjeldatud rakendused on väga suure potentsiaaliga, pole nende kasutuselevõtt ja arendus lihtne. Pea kõiki terviseandmetel põhinevaid rakendusi kummitavad sisuliselt ühed ja samad fundamentaalsed probleemid, millele pole lihtsaid lahendusi. Peamiseks takistuseks on vigade kallis hind. Kui tehisintellektil põhinev rakendus otsustab, millist reklaami näidata või soovitab järgmist laulu, siis on kehvad valikud halvimal juhul tüütud ja võivad tekitada väikese rahalise kahju. Meditsiinis aga võivad igal otsusel olla palju raskemad tagajärjed, ravi protsessi pikenemisest kuni tõsiste tüsistuste ja patsiendi surmani välja. Seetõttu on ka nõuded ja regulatsioonid, mida taolistele süsteemidele rakendatakse, märgatavalt kõrgemad ja niisuguseid probleeme, mida näiteks pildi- ja tekstitöötlusel võib kergemini ignoreerida, tervishoius lubada ei saa. Alljärgnevalt selgitame olulisemaid tegureid, mis tehisintellekti rakendamisel veamäära oluliselt mõjutavad.
Andmekvaliteet
Terviseandmete puhul on suureks probleemiks andmete kvaliteet. Kui arst igapäevase ravitöö käigus andmeid sisestab, ei pruugi ta mõelda sellele, et need andmed oleks hiljem ka automaatseks analüüsiks maksimaalselt kasutatavad. Digiloo puhul näiteks sisestatakse andmeid selleks, et järgmine arst saaks kiire ülevaate, mis on patsiendiga enne tehtud. Selle käigus otsustab arst, mis detailid on tema arvates olulised ja kuidas neid kirja panna. Nii võivad erinevate arstide poolt sama patsiendi kohta tekitatud dokumendid kardinaalselt erineda ja paljud hilisemaks analüüsiks olulised andmed võivad sootuks puududa.
Vabatekstiliste andmete puhul on kvaliteet väga suureks probleemiks. Sama mõtet on võimalik esitada erinevatel viisidel, kasutada suuri või väikseid tähti, lühendeid ja erinevaid termineid. Näiteks veresuhkur, mis on oluline näitaja diabeedi puhul, võib olla tähistatud ka kui glükohemoglobiin, glükoos, B-HbA1c jne. Käsitsi sisestatud teksti puhul on ka kõikvõimalikud kirjavead lihtsad tekkima. Kui näiteks sõna “vererõhk” on valesti kirjutatud, siis ei pruugi me seda tekstist üles leida ja arvame, et väärtus on puudu. Viga võib olla ka väärtuses endas ja nii me leiame tekstis ebarealistlikke tulemusi (nt vererõhk 80/80). Õnneks on keeletehnoloogia meetodeid kasutades võimalik ka niisugusest tekstist mõningast informatsiooni eraldada, kuid ka selle protsessi käigus tekib müra, sest taolised meetodid pole kunagi ideaalsed.
Olulisemad tervisevaldkonna näitajad on standarditud ja kasutamiseks kohustuslikud. Üheks selliseks näiteks on Rahvusvaheline Haiguste Klassifikaator (RHK), mis sisuliselt on kõikide haiguste loend. Kuid ka seal võib esineda probleeme. Diagnoosi panemine on kunst ja samale patsiendile võib olla klassifikaatoris mitmeid sama häid valikuid. Kui selliseid valikuid tehakse juhuslikult, siis pole probleem väga suur, kuid tihti on ühe või teise valiku tegemiseks ka muid põhjuseid. Näiteks kui diagnoosi A ja B korral tuleb välja kirjutada sama ravi, kuid ühe puhul hüvitatakse haigele ravimist 90% ja teisel juhul peab patsient ravimi täielikult kinni maksma, siis arstid hea inimesena valivad diagnoosi, mis on patsiendile soodsam. Taolised süstemaatilised probleemid on väga lokaalsed ja ainult andmete põhjal on neid raske tuvastada.
Andmekvaliteedi probleemide puhul ongi väga oluline aru saada, kas need on juhuslikud või süstemaatilised. Kui probleemid on juhuslikud, näiteks me ei suuda kirjavigade tõttu kogu informatsiooni tekstist eraldada, siis on lahenduseks kasutada rohkem andmeid. Vead üksikutes sissekannetes n.ö keskmistuvad välja (esineb küll vigu nii ühes kui teises suunas, aga keskmine tulemus on ikkagi õige). Kui probleemid on aga süstemaatilised, näiteks teatud välistel põhjustel kasutatakse diagnoosi A rohkem kui diagnoosi B, siis rohkemate andmete kasutamine võib hoopis probleeme võimendada. Mida rohkem on andmeid, seda selgemalt sellised seosed välja tulevad. Seega tuleks kasutada ekspertide abi, et võimalikest probleemidest aru saada ja neid siis analüüsi käigus arvesse võtta.
Selleks, et andmete hulka suurendada, on tihti vaja kasutada erinevaid andmeallikaid, näiteks kombineerida erinevate riikide või andmekogude andmeid. See aga muudab ülesande jällegi keerukamaks. Eri riikides ja ka riigisiseselt eri andmekogudes võivad olla kasutusel erinevad klassifikaatorid ja nende ühetaoliseks teisendamist oskamatult tehes võib andmekvaliteet kokkuvõttes hoopis langeda.
Esinduslikkus
Isegi kui andmeid on palju ja nende kvaliteet on hea, on oluliseks küsimuseks andmete esinduslikkus. Andmed võivad olla kallutatud - s.t mingi välise teguri tõttu kuidagi “erilised” ega esinda päris kõike seda, mida me eeldame, et nad esindavad. Näiteks kui me tahame saada Eesti kõigi haiguste kohta statistikat, siis ei pruugi seda olla mõistlik teha üksnes psühhiaatriahaigla andmete põhjal, kuna nimetatud haigla ei tegele kõigi haigustega. Samas võib saada küllaltki esindusliku statistika, kui kombineerida paari-kolme haiglaliigi andmeid.
Toome veel ühe näite. Kahe haigla andmeid võrreldes võib ilmneda, et ühes haiglas on traumapatsientide suremus suurem kui teises. Kui hakata lähemalt uurima, siis selgub, et selles haiglas on ka oluliselt rohkem raskete traumadega patsiente. See võib viia mõtted sellele, et seal haiglas või haigla poolt teenindatavas piirkonnas on midagi korrast ära. Aga tegelikult on põhjuseks hoopis see, et see haigla ongi spetsialiseerunud rasketele traumadele ja vigastustele, mistõttu raskete traumadega patsiendid viiaksegi kiirabi poolt kohe sinna haiglasse. Paraku kaasneb raskete vigastustega ka rohkem surmasid ja seega pole selle haiglaga otseselt lahti midagi, sest kahe haigla poolt käsitletavad haigusjuhtumid ongi erinevad. Seega tuleb erinevate asutuste andmeid analüüsides alati tähele panna, et andmed võivad olla väliste tegurite tõttu kallutatud ja need välised tegurid ei pruugi olla andmeanalüütikule teada.
Masinõppe algoritme praktikasse rakendades on esinduslikkuse küsimused ääretult olulised. Erinevalt inimesest puudub masinõppe algoritmidel üldine intelligents ja arusaamine probleemist. Nendel puudub intuitsioon, mis tüüpi tunnused on potentsiaalselt olulisemad kui teised, samas on need väga osavad avastama kõike, mis ennustustäpsust treeningandmetes parandab, isegi kui see meile ei tundu mõistlik. Näiteks on igal tehnikul, kes opereerib röntgeniaparaadiga, oma “käekiri” ja iga aparaat annab natuke erinevaid pilte. Radioloogid, kes pilti vaatavad, suudavad selliseid erinevusi lihtsasti ignoreerida. Kui aga taolised erinevused kattuvad ka tulemuseks oleva diagnoosiga, näiteks tehakse keerukamate patsientide pildid uuema ja täpsema aparaadiga, siis võivad just tehnilised erinevused piltide vahel olla need, mille põhjal algoritm otsuse teeb. Sellise algoritmi rakendamisel uues haiglas, kus on ainult uuemad aparaadid, võivad tulemused olla vales suunas tugevasti kaldu.
Laias plaanis saab esinduslikkust tõsta, kui suurendada treeningandmete hulka. Samas tuleb tähele panna, et üksnes rohkem andmeid meid ei päästa, vaid on ka oluline, milliseid andmeid lisatakse. Kuna masinõppe algoritmid töötavad kõige paremini olukordades, mida need enne näinud on, siis peaks treeningandmestik olema võimalikult mitmekesine ja sisaldama kõiki praktikas ette tulevaid situatsioone. Veelgi enam - andmestik võiks kõikvõimalikke eri situatsioone sisaldada enam-vähem samas mahus. Näiteks kui treenida pildialgoritmi tuvastama vähikudet, peaks andmestikus olema enam-vähem võrdselt nii terve koe kui vähikoe pilte. Paraku erineb see soov tihti praktilisest röntgenandmestikust, kus piltide hulk on tugevalt kaldu tervete kudede poole. Treenimisel ei oska aga algoritm seda kallutatust arvesse võtta ja pigem kipub üksikuid vähikoega pilte sootuks ignoreerima, sest need on keskmisest pildist niivõrd erinevad.
Treeningandmete esinduslikkust on võimalik hinnata, kui kaasata tehisintellekti mudelite täpsuse kontrollimiseks ehk valideerimiseks sõltumatuid andmekogusid. Kui mudeli ennustustäpsus uutel andmetel palju ei muutu, siis võib loota, et ta töötab ka praktilistes rakendustes. Kuna meditsiinilised otsused on aga nii suure kaaluga, siis lootusest enamasti ei piisa ja seetõttu on isegi väga perspektiivikatele masinõppe rakendustele raske saada ametlikku heakskiitu.
Iseseisev töö 10
- Ülal kirjeldasime masinõppe süsteemi, mis luges sisse töötlemata meditsiiniandmed, millest suur osa oli vabateksti kujul, ja suutis nende põhjal teha väga täpseid ennustusi. See süsteem oli treenitud kahe USA haigla andmete põhjal. Mõelge, millised probleemid võivad tekkida selle USA andmetel treenitud süsteemi rakendamisel Eestis? Kas USA haiglate andmed on esinduslikud näiteks Põhja Eesti Regionaalhaigla jaoks? Millised aspektid on kõige probleemsemad?
- Isegi kui saame mudeli struktuuri ja teatud aspektid üle kanda, tuleks süsteemi siiski uuesti treenida Eesti andmetel. Oletame, et treenime mudeleid Tartu Ülikooli Kliinikumi andmetel. Kas saadud mudelid on esinduslikud Tallinnas asuva Põhja Eesti Regionaalhaigla jaoks? Aga Hiiumaa haigla jaoks? Millised aspektid on kõige probleemsemad?
- Olgu nüüd meil eelpool kirjeldatud tehisnärvivõrkudel põhinev mudel, mis ennustab tõenäosust, et patsient satub intensiivravi osakonda, mis on treenitud sama haigla viimase viie aasta andmete põhjal. Kui kaua me saame rakendada selles haiglas sama mudelit muutmata kujul? Millised tegurid võivad mudeli prognoose muuta ebaadekvaatseks? Millist mõju avaldaks mudeli ennustuste kvaliteedile muutus keskkonnas, näiteks COVID-19 pandeemia? Kuidas me saaksime hoida mudelit ajakohasena?
Vastused leiate siit: (link).
Tõlgendatavus
Lisaks erinevates valimites ennustustäpsuse hindamisele ongi masinõppe rakenduse täpsuse/kasulikkuse tõestamiseks väga raske midagi teha. Siiski ei tekita selliste numbrite vaatamine lõplikku usaldust mudelite vastu ametkondadel, kes meditsiiniseadmeid turule lubavad, arstidel ega ka patsientidel. Olgugi, et meil võib olla mudel, mis annab tihti õige vastuse, pole selge, mille põhjal on see otsus tehtud ja kas seda on treenitud kõikvõimalike või ainult teatud eriliste patsientide andmete peal. Ehk teisisõnu - kui seda mudelit nüüd hakataks rakendama “minul”, siis kas mudel ikka treenimisel üldse “minu” moodi patsienti näinud on. Näiteks avaldasid Eesti teadlased 2017. a teadusuuringu 1, kus näitasid, et geneetilised riskimudelid, mis maailmas on haiguste riski ennustamiseks loodud, põhinevad valdavalt euroopa päritolu inimeste geeniandmetel ja kui neid rakendada inimesel, kelle juured (nt kaugemad esivanemad) on pärit muudest maailmajagudest, võivad saadud tulemused olla valed.
Üheks usalduse suurendamise võimaluseks on teha “must kast” natuke läbipaistvamaks ja näidata, kuidas algoritm oma otsuseni jõuab, isegi kui see tähendab täpsuse kadu. Kõige kergem viis tõlgendatavust suurendada on kasutada lihtsamat mudelit. See on üks põhjus, miks arstiteaduses kasutatakse väga palju lineaarset logistilist regressiooni. Logistilise regressiooni puhul saab iga tunnus ühe kordaja, mille väärtuse järgi me saame teada, kui palju ja millises suunas antud tunnus ennustust mõjutab. Näide logistilisest regressioonist on eelnevas praktilises töös leitud diabeedi riskiskoor. Selle kordajaid vaadates oli selge, et nii vanus, kehamassiindeks kui ka eelnev kõrgvererõhu diagnoos mõjutavad diabeedi riski suurendavalt. See info kattub arstide kogemusega ja neil ei ole põhjust kahelda mudeli usaldusväärsuses.
Teine arstide seas populaarne mudel on otsustuspuu, mis on kasulik juhtudel, kus otsuseprotsess on vähem lineaarne ja tunnustel on omavahelised koosmõjud. Otsustuspuu läbimine on intuitiivselt sarnane viisile, kuidas arstid patsienti küsitledes jõuavad õige diagnoosini. Jällegi on ka lihtne kontrollida, kas küsimused on kooskõlas olemasoleva teadmisega, mis tekitab arstides algoritmi vastu usaldust.
Paljude ülesannete puhul pole lihtsate mudelite täpsus siiski praktikas kasutamiseks piisav. Näiteks pilditöötluses ei ole võimalik logistilist regressiooni kasutades konkureerida tehisnärvivõrkudega. Piltidelt olulise info välja lugemiseks ongi vaja miljoneid parameetreid, mis on omavahel keerukalt seotud. Kuigi lõpuni selliseid mudeleid mõista pole võimalik, saab nende tööpõhimõtted siiski erinevate võtetega visualiseerida. Näiteks konvolutsiooniliste närvivõrkude puhul, mida kasutatakse piltide klassifitseerimiseks, saab esile tuua need pildi osad, mis panustasid kõige rohkem lõplikku otsusesse. Järgmisel joonisel on toodud näide kopsu röntgeni pildist, kus on esile toodud punase värviga kopsupõletiku diagnoosimisel kõige olulisemaks osutunud piirkonnad.
Joonis 7. Näide kopsu röntgeni pildist, kus on esile toodud punase värviga kopsupõletiku diagnoosimisel kõige olulisemaks osutunud piirkonnad. (Artiklist: https://doi.org/10.1371/journal.pmed.1002683)
Taoline visualiseerimine võib osutuda väga kasulikuks õpitud algoritmist aru saamisel ja näidata potentsiaalseid probleeme. Ülaltoodud pildid illustreerivad närvivõrku, mis on treenitud ära tundma kopsupõletikuga patsientide kopsupilte. Huvitaval kombel on antud piltidel kõige ennustavam piirkond mitte kops, vaid hoopis õlg, millel on näha metallist marker pildi joondamiseks. Selles artiklis olid andmed pärit kolmest erinevast haiglast, milles kopsupõletikuga patsientide osakaal varieerus tugevalt ja kasutati ka erinevaid metallist markereid (pildil õla piirkonnas asuvad L tähe kujulised objektid). Nii osutuski metallist markeri kuju kõige ennustavamaks tunnuseks terve pildid peal. Ilmselgelt selline mudel ei üldistu, kui tahaksime seda rakendada näiteks neljandas haiglas.
See näide illustreerib, kui oluline on mudelite tööst arusaamine, et hoida ära täiesti rumalate mudelite rakendamist praktikas ja vältida arstides ning patsientides usaldamatuse tekkimist algoritmide vastu.
Iseseisev töö 11
Võrdleme kahte mudelit, mis ennustavad patsiendi intensiivravi vajamise tõenäosust. Üks on klassikaline logistilise regressiooni põhine mudel, mille sisendiks on patsiendi vanus, sugu, diagnoos ning olulisemad kaasuvad haigused. Iga tunnuse mõju ja olulisus on mudeli kasutajale teada. Teine mudel põhineb kõigil kättesaadavatel töötlemata terviseandmetel, millele on rakendatud sügavaid närvivõrke, nagu kirjeldatud eelpool toodud näites. Saadud mudel annab treenimiseks kasutatud konkreetse USA haigla andmetel väga täpseid tulemusi (märgatavalt paremaid kui esimene mudel). Samas on mudel väga keeruline ja otsustusprotsessi on raske kirjeldada.
- Kumba mudelit eelistaksid kasutada USAs, sama osariigi mõnes teises haiglas? Mõnes Londoni haiglas? Hiiumaa haiglas?
- Mis on lihtsama logistilisel regressioonil põhineva mudeli eelis teise mudeli ees?
Vastused leiate siit: (link).
Põhjuslikkus
Algoritme tõlgendades proovime sisuliselt aru saada, kas algoritmi õpitud reeglid on kooskõlas meie põhjusliku arusaamisega maailmast. Näiteks kopsupõletiku puhul on teada, et tegu on haigusega, mis avaldub kopsu alveoolides ning muudatused alveoolide väljanägemises avalduvad lõpuks kopsupõletiku diagnoosina terviseandmetes. Kui diagnoos määratakse õla kuju järgi, siis tundub meile, et midagi on valesti.
Ideaalis me sooviksimegi andmetest leida põhjuslikke seoseid, sest sellised teadmised üldistuvad väga hästi. Näiteks, kui meil on algoritm, mis suudab kopsu röntgenipildilt leida alveoolid ning aru saada kas need on normaalsed või haiglased, siis me ei pea muretsema nii palju valimi esinduslikkuse pärast. Mistahes haiglas üle maailma peaksime nii suutma haigust täpselt diagnoosida, sest me kasutame diagnoosimiseks haiguse päris tekkemehhanismi, mitte mõnda tunnust, mis haiguse esinemisega juhtus koos esinema.
Põhjuslikkus tähendab kõige üldisemalt seda, et sündmus A põhjustab sündmuse B. Andmetes esineb see tavaliselt nii, et sündmused A ja B on korreleeritud, ehk siis esinevad tihti koos. Kahjuks võib sündmuste sellist korrelatsiooni põhjustada veel mitu stsenaariumit. Allolev joonis illustreerib olukordi, kus sündmused A ja B on korreleeritud.
Joonis 8. Mõned näited seostest mille puhul andmetes on tunnuste A ja B esinemine korreleeritud, nooleke näitab põhjusliku seose suunda.
Seega isegi väga tugev korrelatsioon andmestikus ei pruugi tähendada põhjuslikku seost. Kui sündmusi A ja B mõjutab mõni kolmas faktor, mille kohta on andmetes mõõtmised olemas, võime me proovida aru saada, millised põhjus-tagajärg seosed on kõige tõenäolisemad. Kuid tihtipeale on väga olulised mõjutegurid mõõtmata. Masinõppe meetodite jaoks on see fundamentaalne probleem, põhjuslikke faktoreid nagu elustiil, dieet, suitsetamine ja isegi olemasolevate haiguste raskusaste on terviseandmetes tihti kehvasti kajastatud. Samas on meil info väljakirjutatud ravimite, diagnostiliste testide ning diagnooside kohta. Kuna sellised olemasolevad andmed korreleeruvad tihti hästi mitte-mõõdetud tegelike põhjuslike faktoritega, saame treenida igal andmestikul suurepäraseid ennustusmudeleid. Näiteks, konkreetsete diagnostiliste testide sooritamine võib korreleeruda hästi haiguse raskusastmega, mis omakorda viitab suuremale intensiivravisse sattumise riskile. Samas, teises haiglas või riigis võivad kehtida teistsugused reeglid testide tegemiseks ning neid teostatakse märksa laiemale hulgale patsientidele. Kuna diagnostilise testi sooritamine ise ei põhjusta suuremat riski, siis võib sellel näitajal põhinev ennustusmudel kaotada suure osa oma täpsusest.
Tegelikult on see probleem isegi teravam ravimeetodite testimisel. Ravimeetodit on mõtet rakendada ainult siis, kui see otseselt põhjustab haiguse või selle sümptomite taandumist - ainult korrelatsioonist ei piisa. Näiteks me võime andmetest leida tugeva korrelatsiooni: peaaegu kõigil inimestel kellel oli jalaluumurd, pandi ka jalg kipsi. Kui me ei teaks, mis on põhjus ja mis on tagajärg, siis võiks ju arvata, et me võime jalaluumurdude arvu vähendada inimestel jalgu kipsi mitte pannes. Kuigi antud näide on triviaalne, siis paljudel juhtudel me põhjuslikku seost ei tea. Näiteks on aastakümneid teatud, et HDL ehk “hea” kolesterooli kõrge tase veres korreleerub madalama südamehaiguste riskiga. See on väga tugev seos ja tuleb välja pea igast suuremast andmestikust. Ka füsioloogiliselt ja biokeemiliselt tundub seos usutav. Seetõttu kulutasid ravimifirmad miljardeid dollareid, et luua ravimeid, mis tõstavad “hea” kolesterooli taset. Inimuuringute faasis selgus aga, et ravimid küll tõstsid “hea” kolesterooli taset, kuid patsientide südameprobleemide risk ei vähenenud. Tuli välja, et seos, mis andmetes leiti, polnud põhjuslik.
Üks võimalus põhjuslike seoste suunda järeldada on vaadelda sündmuste ajalist järgnevust. Jalaluumurru puhul see lähenemine töötab. Enamasti murtakse jalg alati enne, kui see kipsi pannakse. Samas väga suurt kindlust taoline loogika siiski ei anna. Kõrgeid “hea” kolesterooli analüüsinäite mõõdetakse alati enne südamehaiguste teket, aga selgus, et põhjuslikku seost seal siiski pole. On tõenäoline, et mingi teadmata kolmas faktor nagu tervislik toit või aktiivne eluviis tõstab nii “hea” kolesterooli taset kui langetab südamehaiguste riski, lihtsalt mõju kolesteroolile ilmneb varem.
Üldiselt on kõige usaldusväärsem meetod põhjuslike seoste, näiteks ravi efektiivsuse testimiseks, randomiseeritud kontrollitud uuring (RKU). Selle korral elimineeritakse väliste faktorite mõju, otsustades juhuslikult, milline uuringus osaleja saab päris ravi ja milline platseebot ehk petteravimit. Nii välditakse olukorda, et näiteks raskemalt haiged patsiendid saavad üht ravi ja kergemad teist. Järgmisel joonisel on toodud RKU illustratsioon.
Joonis 9. Randomiseeritud kontrollitud uuringu illustratsioon. Me soovime tõestada, et ravim põhjustab paranemist. Meid segavad aga välised faktorid, mis võivad samuti paranemisele kaasa aidata - kaasuvad haigused, eluviisid jne. Et nende mõju välistada, määratakse ravimit saavad ja mitte saavad isikud juhuslikult ilma ühtegi välist faktorit arvesse võtmata. Kui me nüüd ikkagi näeme korrelatsiooni ravimi saamise ja paranemise vahel, tähendab see, et just ravim põhjustab paranemist.
RKU näol on tegemist küll lihtsa metoodikaga, kuid see tähendab, et iga küsimuse jaoks tuleb teha oma uuring ja juba olemasolevaid andmeid kasutada pole võimalik. See ongi üks peamiseid põhjuseid, miks ravimite turuletoomine on niivõrd kallis.
Kuigi RKU-sid teostatakse tänapäeval peamiselt ravimite testimiseks kliinilistes uuringutes, on tegu metoodikaga, mis on kuldstandardiks ka muude raviotsuste efektiivsuse tõestamisel. Nii tuleks ka masinõppepõhiseid otsustustoe süsteeme, mis pakuvad välja reaalseid ravivariante (nt sobiv ravim ja selle doseerimine), testida RKU raamistikku kasutades.
Samas on RKU-l ka üks oluline miinus. Nimelt - tegur, mille mõju me tahame kontrollida, peab selles valemis olema juhuslikkuse alusel sisse- ja väljalülitatav, jättes kõik muud parameetrid muutumatuks (eelmises näites ravimi andmine ja mitteandmine). Kahjuks ei ole paljusid tegureid võimalik niiviisi reguleerida, sest inimeste käitumine ja harjumused on tihedalt seotud kultuuri, elukoha ja kliimaga ning üht parameetrit muutes me paratamatult mõjutame ka teisi. See on ka põhjus, miks haiguste tegelikke põhjuseid, näiteks suitsetamise põhjuslikku seost vähiga, on väga raske tõestada.
Üheks huvitavaks valdkonnaks, kus meditsiiniandmeid kasutades on võimalik leida põhjuslikke seoseid, on ka geneetika. Näiteks Tartu Ülikooli Geenivaramu on osalenud paljudes uuringutes, kus otsitakse seoseid geenivariantide ja haiguste vahel. Sellised seosed on teadlastele väga väärtuslikud just nende põhjuslikkuse tõttu. Inimese genoom püsib elu jooksul ühesugune ning uuritav haigus ja välised faktorid geene muuta ei saa. Seega tähendab tugev korrelatsioon geenivariandi ja haiguse esinemise vahel, et antud geenil peab haiguse tekkes olema mingi roll.
Iseseisev töö 12
Terviseandmetel ennustusmudelite loomisel peame paratamatult kaasama tunnuseid, mis esindavad raskemini mõõdetavaid põhjuslikke tegureid nagu elustiil, alkoholitarbimine, dieet või geneetika. Niikaua kui me treenime ja rakendame oma mudelit väga sarnastel andmetel, pole tegelik põhjuslikkus mudeli täpsuse seisukohast oluline. Isegi kui näiteks alkoholitarbimine ise pole põhjuslik tegur, siis võib see olla indikaatoriks inimese kultuuriruumist ja tegelik põhjus võib peituda mingis muus selle kultuuriruumi harjumuses. Kuni need assotsatsioonid püsivad muutumatuna, on mudeli täpsus hea isegi juhul, kui ta tegeliku põhjuse asemel kasutab sisendparameetrina alkoholitarbimist. Kui me aga tahame mudelit kasutada uues kontekstis, siis mitte-põhjuslikud tegurid ei pruugi enam põhjuslikega nii selgelt seotud olla ja mudeli ennustusvõime võib märgatavalt langeda.
Oletame, et soovime Eesti andmetel luua ennustusmudeli patsientide infarktiriski hindamiseks ning rakendada seda ka Soomes ja Karjala Vabariigis Venemaal. Inimesed neis kolmes kohas on suhteliselt sarnase geneetilise taustaga, aga kliimas, kultuuris, elatustasemes, meditsiinisüsteemi rahastuses, praktikates ja kvaliteedis esineb kindlasti erinevusi. Mudeli loomiseks saame kasutada tunnuseid nagu vanus, kehakaal, diagnooside-, ravimite- ja teostatud diagnostiliste uuringute ajalugu.
- Mõtle iga tunnuse puhul, kas tegu on ise põhjusliku teguriga või millist põhjuslikku tegurit see tunnus esindada võiks. Tihti on tõesed mõlemad variandid.
- Lisaks hinda iga tunnuse puhul, kui tõenäoline on, et Eesti andmetel õpitud seosed kehtivad ka Soome või Venemaa andmetel. Millistel põhjustel ei pruugi ennustus kehtida?
Vastused leiate siit: (link).
1 https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0179238
< eelmine | 8. OSA sisukord | järgmine > |