< eelmine | 7. OSA sisukord | järgmine > |
7.2 Inimese ja masina interaktsioon autor: Karl Kruusamäe
Nüüd, kus teame, mis on robot ja mille jaoks neid tarvis, on paras hetk küsida: miks on inimese ja roboti vaheline interaktsioon keeruline teema? Kuna robot on olemuslikult masin, siis vaatleme kõigepealt inimese interaktsiooni masinaga pisut laiemalt.
Maailmas on miljoneid seadmeid ehk masinaid, mis omavahel pidevalt ja kiiresti suhtlevad. Kogu internet tugineb teatud tüüpi masinate (arvutid, ruuterid jne) omavahelisel ja hästi koordineeritud interaktsioonil. Masinad vahetavad infot ehk suhtlevad üheselt defineeritud keeles, st järgides väga ranget protokolli. Iga kõrvalekalle protokollist on viga ning hästi loodud tarkvaras toimub ka pidev veakontroll. Vea ilmnemisel heidetakse vigased andmed kõrvale ning andmete kahetimõistetavust ei tohi kunagi tekkida.
Inimestel on suhtlemiseks küll keel, aga nagu me juba keeletehnoloogia õppetükis lugesime, siis on see teinekord mitmetähenduslik. Igaüks meist on olnud olukorras, kus meie suhtluspartner saab meist hoopis teisiti aru, kui me ise mõtlesime. On ka situatsioone, kus hoopis millegi ütlemata jätmine võib sisaldada olulist informatsiooni suhtluspartnerile. Seega inimeste omavaheline suhtlus ei ole rangelt määratletud ja alati üheselt mõistetav. Samuti pole alati selge, kes siis ikkagi suhtlusvea tegi, kui tõlgendused on erinevad.
Selleks, et inimesed ja robotid saaks omavahel infot vahetada ehk suhelda, peab kas inimene õppima selgeks masinate üheselt defineeritud keele või robot hakkama aru saama inimeste mitmetähenduslikust keelest.
Siin aga tekib veel üks põnev tahk. Mis on inimese roll konkreetse interaktsiooni puhul? Kui räägime robotist, mida inimene juhib, siis võime eeldada, et inimene õpib ära, kuidas robotit kontrollida. Sellisel juhul on inimene roboti operaator. Aga kui me satume tänaval vastamisi robotiga, siis kas me saame eeldada, et iga inimene oskab igale võimalikule robotile korraldusi anda? Sellisel juhul peab hoopis roboti tarkvara oskama reageerida inimese käitumisele, kes pole tingimata operaator. Mõtleme nüüd korra tagasi Joonisel 11 kujutatud roboti üldisele definitsioonile. Kui inimene juhib robotit ehk ta on roboti operaatori rollis, siis üks tema peamisi ülesandeid on roboti poolt tajutu mõtestamine, plaani üle otsustamine ja tegevuseks käskude andmine. Kui robot proovib iseseisvalt inimest mõista, siis inimest tajutakse ning mõtestamine ja otsustamine toimub juba tehisintellekti abil.
Seega peab juba robotit luues mõtlema väga hoolikalt inimese ja roboti interaktsioonile: kuidas saab operaator anda robotile korraldusi ning kuidas võiks robot tajuda inimesi?
7.2.1. Näide: inimese ja telefoni interaktsioon
Illustreerimaks, kuidas inimese ja masina interaktsioon võib muutuda koos tehnoloogia arenguga, vaatleme illustratiivset näidet telefonide maailmast.
Selleks, et helistada varajaste telefonide abil, tuli inimesel tõsta toru ja paluda teisel inimesel (keskjaamas paikneval operaatoril) end ühendada kõne vastuvõtjaga. Hilisem tehnoloogia areng võimaldas inimesel valida numbri kasutades telefonile paigutatud ketast. Elektroonika areng viis selleni, et võrdlemisi tüütu ketas asendati nuppudega. Nii kettaga kui ka nuppudega telefonide puhul pidi helistaja teadma selle inimese telefoninumbrit, kellele helistada soovis ning selle ketta või nuppude abil ühenduse loomiseks sisestama. Valeühendused kogemata valesti valitud numbri tõttu olid tavalised. Ka kõne vastuvõtjad olid harjunud, et aeg-ajalt ikka keegi numbri valimisel tehtud vea tõttu just neile helistab. Kuigi olulisemate numbrite salvestamine telefoni mällu ja sealt nende kiirkorras valimine muutus võimalikuks enne mobiiltelefone, siis 90datel plahvatuslikult kasvanud mobiiltelefonide kasutamisega muutus tavaliseks ka telefonides olev kontaktide loetelu. Nüüd sai telefoninumbrid ja nendega seotud nimed salvestada ja helistamiseks tuli lihtsalt valida õige nimi ja seejärel kõne alustamiseks helista-nupule vajutada. Kaasaegsete nutitelefonidega saab aga kõne algatada ilma telefoni kordagi puutumata, piisab kui hüüda selge häälega telefoni suunas vastav korraldus, nt „Helista Tomile“. Nagu näha, on see, kuidas inimene kõne alustamiseks telefonile korraldusi annab, muutunud märkimisväärselt. Ja ilmselt on enamik nõus, et telefoni kasutamine on inimese jaoks muutunud aina mugavamaks. Kuid analoogseid näiteid selle kohta, kuidas inimese ja mõne masina interaktsioon on ajas muutunud ja muidugi mugavuse suunas, saaks tuua mitmeid.
Tehisintellekti areng ja võimalused julgustavad meid unistama sellisest kasutusmugavusest, kus inimene ise ühegi masina kasutamist õppima ei pea, vaid masina intelligentsed algoritmid suudavad iseseisvalt tõlgendada kasutaja soove.
7.2.2. Näide: inimese ja auto interaktsioon
Vaatame veel ühte näidet. Sõiduautode puhul toimub inimese ja sõiduki interaktsioon rooli, pedaalide ja käigukangi abil. Inimene on selgelt juhi ehk operaatori rollis. Kuigi sõiduki armatuurlaualt saab inimene pisut tehnilist infot, siis tegelikult piisab juhtimiseks ka ainult sellest, mis paistab läbi tuuleklaasi.
Kaasaegsed sõiduautod pakuvad juhile mitmeid tarkvaralisi abilisi, nt püsikiiruse ja sõiduraja hoidmine. Kuigi need tehnoloogilised abivahendid muudavad sõiduauto juhtimist teatud oludes märkimisväärselt mugavamaks, siis inimene on jätkuvalt masina operaatori rollis.
Kui nüüd aga mõelda isejuhtiva auto peale, siis tegelikult pole selles viibiv inimene enam juht, vaid reisija. Kas see tähendab, et inimese ja sõiduki vahel pole enam interaktsiooni? Kindlasti mitte. Isesõitva auto puhul on tarvis moodust, et inimene saaks sõidukile öelda, kuhu ta minna soovib. Samuti peab isesõitev auto interakteeruma teiste liiklejatega, nt teised autojuhid ristmikul või ülekäiguraja ääres seisev inimene.
Seega inimese ja auto puhul toimub taustal üks ilmutamata protsess: interaktsiooni teisenemine, st interaktsiooni olemus võib muutuda kardinaalselt. Inimene nihkub sõna otseses tähenduses juhiistmelt tagaistmele ja sellega koos muutub tema roll: masina operaatorist reisijaks.
7.2.3. Masina autonoomsus ja interaktsiooni laad
Eelnevatest näidetest võisime märgata, et inimese ja masina interaktsiooni vormi ja sisu mõjutab oluliselt, kui arenenud on tehnoloogia. Mida algelisem on masin, seda rohkem peab inimene seda juhtima – inimene peab õppima masinat kasutama. Ja mida iseseisvamalt toimetab masin, seda olulisem on masinal aru saada inimesest, kes pole tingimata õppinud selle kasutamist. Masina või roboti iseseisvat toimetulekut kirjeldatakse autonoomsuse tasemete abil. Varasemalt oleme antud kursusel käsitlenud isejuhtivate autode autonoomsuse tasemeid, kuid tegelikult saab nende abil kirjeldada mistahes masinate võimet iseseisvalt ülesannetega toime tulla. Autonoomsuse tasemeid võib kirjeldada erinevalt, kuid üldiselt viitab madalam tase operaatori vajadusele ning kõrgem autonoomsuse tase tähendab, et robot on võimeline oma ülesandeid iseseisvalt täitma ja kokkupuutel inimesega saab aru viimase soovidest.
Ehk siis, kui roboti autonoomsuse tase tõuseb, siis nihkub ka inimese ja roboti interaktsiooni olemus süsteemi pidevalt kontrollivalt inimeselt tehisintellektile, mille ülesanne on nüüd tõlgendada inimest ja tema kavatsusi (Joonis 13). Selline analoogia kehtib ju väga selgelt inimese ja inimese vahelises suhtluses. Nt mida iseseisvam on tööline oma ülesannete täitmises, seda vähem peab juht tema tegevustesse sekkuma ja nende sisu korrigeerima, küll aga peab tööline hästi mõistma, mis on tema juhi või organisatsiooni peamine eesmärk ehk kavatsus.
Kõigil masinatel on olemas seadmed, et interakteeruda inimesega. Need seadmed saab üldiselt kategoriseerida kas sisend- või väljundseadmeteks. Sisendseadmeid kasutab inimene, et masinale infot sisestada, nt telefoniketas numbri sisestamiseks või gaasipedaal auto kiiruse muutmiseks. Väljundseadmed annavad inimesele infot, nt telefon heliseb, kui keegi helistab või auto spidomeetril näitab osuti, kui kiiresti hetkel sõidame. Kui mõtleme klassikalise arvuti peale, siis klaviatuur ja hiir on sisendseadmed ning kuvar ja kõlarid väljundseadmed. Väljundseadmed saavad ära kasutada kõiki inimmeeli ja nende kombinatsioone, kuid kõige sagedamini kohtame süsteeme, kus inimene kasutab info vastuvõtmiseks nägemis-, kuulmis- ja kompimismeelt.
Interaktsiooni laad (ingl modality) kirjeldab moodust, kuidas inimene ja masin infot vahetavad. Enamik kaasaegseid süsteeme võimaldavad kasutajal masinaga suhelda mitmel eri moel (ingl multimodal), nt nutitelefoniga saab kõnet alustada nii aadressiraamatust näpuga õige kontakti peale toksates kui ka häälkäsklusi andes.
Kui räägime robotitest, siis interaktsioon inimesega käib tihti läbi arvuti, seega sisendseadmeteks on klaviatuurid ja spetsiaalsed juhtpuldid ning väljundseadmeks on robot ise oma tegutsemisega ja info arvuti ekraanil. Võrdlemisi hiljuti on lisandunud nutiseadmed puutetundlike ekraanidega, mis on samaaegselt nii sisendiks kui ka väljundiks. Valik võimalikke sisendseadmeid ja nende paigutumine skaalal “inimene juhib robotit vs robot mõistab inimest” on toodud Joonisel 14. Nagu varasemalt mainitud, siis tehisintellekti abil nihkub inimesega suhtlemine roboti taju maailma, seega võib robotile inimesega suhtlemiseks paigutada kaamera, et analüüsida inimese kehakeelt. Samuti arendatakse hoogsalt mooduseid, et jälgida inimese ajutegevust ja seeläbi paremini mõista inimest. Joonisel 15 on illustreeritud, kuidas sisendseadmed paigutuksid roboti põhilisest toimimisloogikast lähtuvalt: kui operaator tegeleb mõtestamisega, siis ta suure tõenäosusega kasutab roboti tegevuse juhtimiseks spetsiaalset pulti või arvutiklaviatuuri. Kui aga mõtestamise põhikoormus on tehisintellekti kanda, siis inimese kavatsust tajutakse näiteks videokaamera abil.
7.2.4. Inimene kui operaator
Kuigi esmapilgul võib tunduda, et väga lihtne on panna inimene laua taha istuma ja robotit juhtima, siis tegelikkuses on osutunud see palju keerukamaks. Reeglina peab robotite juhtimisel tähelepanu pöörama paljudele erinevatele aspektidele ning see võib lõpuks tähendada, et ühe roboti juhtimiseks on tarvis rohkem kui ühte inimest (Joonis 16).
Joonisel 16 on toodud üks allveeroboti kontrollruum ja kahele operaatoile mõeldud kuukulgur Sorato kasutajaliides.
Joonis 16. (a) Allveeroboti ja (b) kuukulguri juhtimispuldid, mis on mõeldud rohkem kui ühele inimesele.Allikas: IEEE, ESA
Võib hästi ette kujutada, kui keeruline on õppida Joonisel 16 kujutatud kasutajaliideseid kasutama. Nt kui 2011. aasta märtsikuu järgselt oli Jaapanis tarvis kasutada roboteid, et vaadata hiidlaine tõttu kahjustada saanud Fukushima tuumajaama hoonete sisse, siis üks peamine takistus oli see, et tuumajaama töötajad ehk hoonetega hästi kursis olevad inimesed pidid kulutama tohutult palju aega, et õppida kasutama neid keerukaid roboteid, mida nad polnud varem kasutanud. Sisuliselt ebaõnnestusid kõik esimesed katsed robotite abil olukorda ohutult hinnata.
On kaks võtmetegurit, mis muudavad robotite kaugjuhtimise inimesele keeruliseks:
- Situatsiooniteadlikkus kirjeldab inimese võimet omada ülevaadet roboti keskkonnast.
- Konteksti üleminek kirjeldab erinevust inimesel kasutada olevate juhthoobade ja roboti tegevuse vahel.
Situatsiooniteadlikkuse peamine eesmärk on anda inimesele võimalikult palju informatsiooni roboti hetkeseisukorra ja seda ümbritseva keskkonna kohta. Kuigi eesmärk on õilis, siis info kogus, mida robot inimesele edastada saab on tohutult suur, nt pildid eri suundadesse vaatavatest kaameratest, roboti tehnilist seisundit kirjeldavad näidikud. Kogu seda infot on reeglina liiga palju, et üks inimene kõike jälgida suudaks ja seetõttu leiamegi roboti juhtpaneeli eest tihti rohkem kui ühe inimese. Arusaadavalt suudab mitu inimest samaaegselt rohkem infot läbi analüüsida, ent nüüd peavad inimesed omavahel oma tegevusi koordineerima.
Konteksti üleminek on aga seotud inimese võimekusega masinat edukalt juhtida. Kui inimene lahendab mõnda käelist ülesannet, siis saame eristada kahte konteksti:
- Kuidas lahendada antud ülesanne ehk ülesande kontekst
- Kuidas lahendada antud ülesanne oma keha, nt käte abil ehk tegija kontekst.
Roboti kaugjuhtimisel tekib aga mitu uut konteksti, mis nõuavad inimeselt palju rohkem vaimset pingutust:
- Kuidas lahendada antud ülesanne ehk ülesande kontekst
- Kuidas lahendada antud ülesanne robotil olevate ajamite abil ehk roboti kontekst
- Kuidas juhtida ajameid inimesele kasutada olevate sisendseadmete abil ehk kasutajaliidese kontekst
- Kuidas juhtida oma keha, et sisendseadmeid kasutada ehk tegija kontekst
Oluline on siinkohal ära märkida, et ühe ja sama ülesande puhul võib tegija kontekst olla kardinaalselt erinev, sõltuvalt sellest, kas ülesannet lahendatakse vahetult inimese poolt või roboti operaatori poolt. Inimene, kes oskab oma kätega kokku panna käokella, ei pruugi olla võimeline sama asja tegema robotit puldiga juhtides.
Konteksti üleminekut mõistes saame teha kiire järelduse, et kui robot, mida juhime, on võimalikult inimese sarnane, siis võiks selle kasutamine mistahes ülesande lahendamisel olla kõige intuitiivsem. Ent kui vaatleme hoopis ülesande perspektiivist, siis ei pruugi inimesesarnane robot olla alati parim masinadisain selle lahendamiseks. Nt ookeani põhjast maavarasid kaevandada oleks kasulikum masinaga, mis meenutab samaaegselt allveelaeva ja kombaini.
7.2.5. Robot kui kolleeg
Tehisintellekti abil loodetakse luua roboteid, mille juhtimine oleks intuitiivne. Näiteks saaks inimesed neile korraldusi anda suuliselt. Suulised korraldused eeldavad aga, et robot on ülesannet täites oluliselt iseseisvam (st kõrgema autonoomsuse tasemega). Seega on võimekat tehisintellekti tarvis nii korralduse mõistmisel kui ka selle elluviimisel. Need on kaks täiesti isemoodi tehnilist katsumust. Nt kui inimene ütleb robotile: “Too mulle tass kohvi kõrvaltoast!” Kõigepealt tuleb robotil aru saada inimkõnest ja ülesande olemusest. Ja alles seejärel liikuda kõrvaltuppa, võib-olla isegi avada mõni uks, leida üles kohvitass, korjata üles see kohvitass ning toimetada see inimesele, kes korralduse andis. Nagu näeme, siis selles näites usaldati konteksti üleminekust tulenevad keerukused tehisintellektile.
Teiseks võib tehisintellektist olla kasu info edastamisel operaatorile. Keerukad kasutajaliidesed kuvavad küll kogu saadavaloleva info, kuid operaator peab infost ise tervikpildi kokku panema. Mida keerukam süsteem, seda rohkem on reeglina aga infot. Nüüd võiks aga tehisintellekti abil filtreerida välja sellest oluliseima osa ning esitada seda parimal võimalikul moel, kas siis selges inimkõnes, hästi kujundatud graafikuna või kolmemõõtmelise mudelina.
Siinkohal on Eesti ettevõtte Milrem Robotics meie kursusel osalejate jaoks ette valmistanud video inimese ja roboti interaktsiooni kohta nende praktilistes rakendustes. Lauri Tammeveski, Milrem Robotics tarkvarainsener, räägib, milliseid probleeme ettevõte lahendab tehisintellekti kasutades.
Ent kuniks algoritmid ja robotid veel alles õpivad inimkolleegidest aru saama, võib roboti juhtimine oluliselt lihtsustuda, kui saame korraldusi anda ka käsipidi nagu võib näha kahes alljärgnevas videos.
1) Esimeses videos demonstreeritakse hoolderobotit, mis aitab põetajal liigutada inimest. Terane silm märkab, et roboti juhtimine käib selle käsi ja keha õrnalt suunates. Seega pole taolise robotkolleegi juhtimiseks väga palju jõudu tarvis: kindlasti oluliselt vähem, kui inimese kätel kandmiseks.
2) Pea igale kobotile saab anda korraldusi seda õigesse asendisse suunates. Antud videos näitab inimene käsipidi robotile tee ette, mida viimane edukalt imiteerib. Sedalaadi roboti programmeerimine võib sobida hästi näiteks siis, kui robot peab asju ühelt konveieriliinilt teisele tõstma.
7.2.6 Inimese kavatsust ennustav robot
Robot, mis tänu tehisintellektile toimetab nagu eeskujulik kolleeg, kuulab inimpartneri sõna - seega me saame eeldada, et see inimpartner on siiski harjunud või õppinud oma robotkolleegiga interakteeruma. Kuidas peaks aga masin hakkama saama, kui inimene pole ei masina operaator ega kolleeg. Näiteks isejuhtiv sõiduk peab aru saama, mida teepervel seisev isik järgmiseks teeb ning selleks on vaja algoritme, et tuvastada ja tõlgendada inimese kavatsust. Joonisel 17 on kujutatud, kuidas kaamera abil ennustatakse, et paremas teeservas autode vahel seisvad inimesed kavatsevad ilmselt teed ületada ning auto otsustab seetõttu aeglustada ja inimesed üle lasta.
Inimese täpse kavatsuse ennustamisest on kasu ka siis, kui inimene ja robot tegutsevad koostöös. Inimene ei pruugi alati väga selgelt sõnades väljendada, mida ta järgmiseks teha plaanib. Koostöö ladusaks kulgemiseks on taaskord abi erinevatest tehisintellekti algoritmidest, mis suudavad analüüsida inimese käitumist. Nt OpenPose tarkvara leiab kaamerapildist üles inimese ja tema täpse kehaasendi. Seda teadmist saab edasi kasutada, et hinnata, mida inimene vaatab, kuhu inimene liigub või mida inimene haarab.
7.2.7. Mõttejõul robotite juhtimine
Mõttejõul robotite juhtimine võib paljudele tunduda rohkem nagu ulmefilmi teema. Ent eksisteerib reaalne vajadus tehnoloogia järele, mille juhtimiseks kasutame inimese enda mõtteid. Liikumispuudega inimesed saavad mõttejõul juhitud ratastooli abil tagasi liikumisvõimaluse (Joonis 19(a)) ning robot, mis ulatab halvatud inimesele joogipudeli (Joonis 19(b)) võimaldab suurendada inimese võimet üksi toime tulla. Robotproteesid (Joonis 19(c) taastavad inimese normaalse elutunnetuse kõige paremini, kui nende kontrollimine on sama lihtne kui bioloogilise jäsemega – piisab vaid sellele mõelda.
Joonis 19. Mõttejõul roboti juhtimist on edukalt demonstreeriud nii ratastooli, abikäe kui proteesi näitel. Allikas: MIT, T. Tiimus, Freethink
Nagu arvata võib, siis on mõtete lugemine erakordselt keeruline, sest inimajust saab välja lugeda suures koguses eri signaale, mis esmapilgul võnguvad väga kaootiliselt. Üks „lihtsamaid“ mooduseid, kuidas õige “mõte” ajusignaalidest üles leida, on see sinna läbi inimese silmade istutada.
Piltlikult, kui me näitame inimesele õuna ja palume inimesel mõelda selle peale, mida ta näeb, siis me võime öelda, et tema ajupilt kirjeldab õuna. Muidugi on tegu erakordse lihtsustusega inimaju tööst, aga analoogset ideed on siiski suudetud praktikasse rakendada. Nimelt, kui vilgutada inimese silme ees kindla sagedusega valgust, siis mõne aja möödumisel suudame tuvastada selle sama sageduse ka inimese ajusignaalidest. Kui nüüd näiteks ratastooli juhtpaneelil vilgub nupp „edasi“ sagedusel 6 Hz ja „stopp“ nupp sagedusel 20 Hz, siis saamegi ajusignaale jälgides tuvastada, kas inimene vaatas edasi- või stopp-nuppu.
Kui lugejal on rohkem huvi teada saada, kuidas toimub robotite juhtimine mõttejõul, siis väga põhjalikku ülevaadet saab lugeda T. Tiimuse eestikeelsest magistritööst:
http://hdl.handle.net/10062/60713
Sellest tööst on pärit ka järgnevad kaks videot:
Esimeses videos on näha, kuidas sülearvuti ekraanil vilguvad neli punast kastikest (iga kastike vilgub erineva sagedusega). Kui roboti juhtprogramm tuvastab ajusignaalidest, millist kastikest inimene vaatab, siis robot liigub kas üles, alla, vasakule või paremale. Pisike kollane tähis punase kastikese juures näitab, millist kastikest, ajupildi põhjal, inimene vaatab.
Kuigi kasutaja näeb jätkuvalt nelja vilkuvalt kastikest, siis roboti juhtprogrammis on muudetud nende tähendust. Vasakpoolsele kastile keskendumine tähendab teepudeli haaramist ning parempoolse kasti jälgimist käsitletakse kui teepaki haaramist. Kõige alumine kastike suunab roboti inimese juurde.
Lisaks võib vaadata ka järgnevaid videoid:
link1 -- Selles ingliskeelses lühidokumentaalis saab kaasa elada ühe lustaka mehe eduloole, kus robotprotees on ühendatud tema närvisüsteemiga.
link2 -- Robotproteesi juhtimiseks ei pea tingimata kohe aju- või närvisüsteemisignaale tõlgendama ruttama, tehisintellekti algoritmide abil saab tõlgendada inimlihaste pingutusi nahapinnalt, nagu seda tehakse Open Bionicsis. Kohe video alguses demonstreeritakse käe sulgumist ja avanemist, mida proteesikandja juhib käelihaseid pingutades.
< eelmine | 7. OSA sisukord | järgmine > |