3. OSA. Tehisnärvivõrgud masinnägemises autor: Ardi Tampuu
Masinnägemise probleemipüstitus
Inimene suudab pilti vaadates vastata paljudele huvitavatele küsimustele, näiteks:
- Mis on pildil? (Mis tüüpi objektiga on tegu?)
- Kes on pildil? (Kas ma tunnen seda inimest?)
- Kus asub pildil mingi objekt?
- Mis on pildile kirjutatud? (Suudan ma teksti täht tähe haaval tuvastada?)
- Kas see pilt on foto, joonistus või maal?
- Kas sellel joonistusel/maalil on äratuntav stiil, mis lubab arvata, kes on selle teose autor?
- Kas see foto näib loomulik või on seda töödeldud?
- jne.
Kõikide nende küsimuste puhul oleks väga tore, kui me suudaksime luua masinõppe mudeli, mis neile automaatselt vastaks. See võimaldaks näiteks automatiseerida ümbrikutelt aadresside lugemist (4. punkt), isikutuvastust (2. punkt) või võltsitud (pahatahtlike) fotode tuvastamist (7. punkt). Punktid 1 ja 3 on hädavajalikud isejuhtivate autode loomiseks.
Neile küsimustele vastamine on inimese jaoks triviaalselt lihtne. Kuna masinõppe algoritmid on väga võimekad paljude teiste ülesannete lahendamises, siis on loomulik loota, et nad on võimelised ka neile "lihtsatele" küsimustele vastama.
Siinkohal on aga oluline aru saada, et inimeste nägemisvõime on arenenud sadade miljonite aastate jooksul ja me tegelikult ei taju, kui keerulist probleemi meie aju silmadest tulevat signaali mõtestades lahendab. Enne, kui pildil olev info jõuab teadvusesse, on erinevad rakud silmas ja ajus juba muutnud valguse tugevuse ja lainepikkuse elektriliseks signaaliks, kombineerinud erinevate värviretseptorite signaalid värvi- ja heledustajuks, eristanud tausta objektist, tuvastanud objekti piirjooned, andnud hinnangu objekti kaugusele ja palju muud. Kõik see juhtub teadvustamata ja vaatamata teadlaste pingutustele ei tea me, kuidas täpselt aju seda teeb.
Seega tuleb masinnägemise algoritmidel pildi mõistmiseks teha rohkem tööd kui meil, sest meie jaoks on suurem osa tööd aju mitte-teadvustatud protsesside poolt juba ära tehtud. Vaatamegi esimeses sissejuhatavas peatükis, kuidas arvutites pildid kujutatud on ehk, mis on see sisend, mille põhjal masinnägemise mudelid otsuseid tegema peavad. Seejärel vaatame peatükis "Tehisnärvivõrgud masinnägemises", millised on need keerulised mudelid, mis pilte mõista suudavad. Viimased kolm peatükki selles moodulis koosnevad peamiselt näidetest, kus ja kuidas neid tehnoloogiaid rakendada saab. Pärast loengut ootab teid veel üks praktiline näide ning siis tuleb teil sooritada Moodle'i keskkonnas test.
Masinnägemise moodul sisaldab järgmisi peatükke: