Kompiuteris, skenuojantis žmogaus kūną, ar robotas, padedantis atrinkti brokuotas prekes, šiais laikais jau nieko nebestebina. Tačiau ar įsivaizduotumėte, kad televizorius galėtų „nuskenuoti“ žmogaus kūną ir paklausti, ar mums viskas gerai? Kad vos rankos mostu būtų įjungiamas ar išjungiamas šviesos jungiklis, o judesio jutikliai stebėtų vyresnio amžiaus artimuosius ir, vos tik nutikus nelaimei, nedelsdami apie tai praneštų jų šeimai?
Kauno technologijos universiteto (KTU) Elektros ir elektronikos fakulteto (EEF) profesorius dr. Vidas Raudonis įsitikinęs, kad netolimoje ateityje tokios technologijos taps natūralia mūsų kasdienio gyvenimo dalimi.
„Mes patys galėsime regėti daugiau, nes neapsiribosime tik regimąja šviesa“, – sako V. Raudonis.

Visa tai ir panašūs sprendimai tampa įmanomi dėl kompiuterinės regos – dirbtiniu intelektu (DI) paremtos technologijos, leidžiančios „mašinoms“ (plačiąja prasme) „matyti“ jas supantį pasaulį ir jį suvokti per mums įprastas vaizdo kameras. Dar daugiau – ne tik suvokti, bet ir priimti savarankiškus sprendimus, remiantis vaizdine informacija.
Technologijų plėtra pramonėje – sparti
Pasak V. Raudonio, kompiuterinė rega šiandien taikoma itin plačiai – nuo pramoninės gamybos iki žmonių srautų stebėjimo viešose erdvėse. Pavyzdžiui, kai kuriose šalyse gyventojai stebimi per vaizdo kameras, o už netinkamą elgesį gali sulaukti nuobaudų.
Gamybos pramonėje šios technologijos diegiamos gana paprastai. Jau dabar egzistuoja produktų, kurie, būdami ne didesni nei internetinės kameros, savo viduje turi integruotus kompiuterius. Šie mažyčiai kompiuteriai gali 24 valandas per parą, 7 dienas per savaitę analizuoti produkcijos vaizdus ir aptikti defektus.
Lietuvoje kompiuterinės regos pagrindu veikiančios defektų aptikimo sistemos dažniausiai naudojamos baldų gamybos pramonėje, tačiau tokie sprendimai sparčiai diegiami ir kitose srityse.
„Pavyzdžiui, kompiuterinė rega padeda roboto rankoms nustatyti konvejeriu judančių objektų sugriebimo taškus. Tai jau tapo tam tikra norma“, – teigia KTU profesorius.
Medicinoje būtinas žmonių pasitikėjimas

Šiuo metu V. Raudonis kompiuterinės regos technologijas dažniausiai taiko žmogaus reprodukcijos srityje. Čia reikia automatiškai įvertinti inkubatoriuje auginamo embriono kokybę, iš histologinių vaizdų nustatyti gimdos receptyvumą ir pagal vaizdo medžiagą įvertinti spermatozoidų sveikatą.
Vis dėlto medicinos srityje, kitaip nei daugelyje kitų pramonės šakų, šių technologijų taikymas nėra toks paprastas. Norint jas pradėti naudoti, būtina gauti atitinkamus sertifikatus. Tam reikia pereiti daugybę testavimo etapų: iš pradžių atliekamas modeliavimas, vėliau – bandymai su gyvūnais, galiausiai – su specialiai atrinkta žmonių grupe.
Tačiau net ir turint visus reikiamus sertifikatus, žmonės dažnai vis dar mieliau renkasi, kad ligą diagnozuotų gydytojas, o ne sistema. Todėl kompiuterine rega paremtų technologijų diegimas medicinoje reikalauja ir žmonių pasitikėjimo, kurį būtina užsitarnauti.
Kas yra kompiuterio „akis“?
KTU profesorius pasakoja, kad dirbtinis intelektas, kuriuo remiasi ir kompiuterinės regos technologijos, sąmoningai „nežino“, iš kur atkeliauja signalas. Panašiai ir žmogaus smegenys, uždarytos tamsioje, drėgnoje erdvėje – kaukolėje, tiesiogiai „nemato“, iš kur ateina impulsai.
Visi signalai biologinėje sistemoje yra konvertuojami į elektrocheminį impulsą, kuris keliauja neuroniniais raizginiais. Tik dėl sąmonės mes vėliau atsirenkame, kad, pavyzdžiui, iš užmerktos akies signalas vis tiek ateina, bet iš jo mažai naudos. Lygiai taip pat ir dirbtiniam intelektui mes duodame ne vaizdą, garsą ar tekstą, o skaičius – analogiškus elektrocheminiam impulsui, kuriais ir operuoja DI modeliai.
DI modeliai išmoksta tam tikras skaičių kombinacijas, būdingas, pavyzdžiui, vaizdams su katėmis, o vaizdai su šunimis pasižymi visai kitokiomis skaičių struktūromis.
„DI išmoksta atpažinti tas skaičių kombinacijas, kurias užfiksuoja vaizdo kameros. Tam tikra prasme tai galima traktuoti kaip kompiuterio akį“, – sako KTU profesorius.
Kol kas pranašesnis žmogus
Pagrindinis iššūkis mokant DI modelius, anot V. Raudonio, yra pats pasaulio tikroviškumas – jo nenuspėjamumas ir didžiulė formų, spalvų bei dydžių įvairovė.
„Viskas, kas mums, biologinėms būtybėms, kelia nuostabą ar susižavėjimą, DI modeliams tampa dar viena įvairovės forma, kelianti papildomų iššūkių“, – teigia profesorius.
Vis dėlto DI turi ir aiškų pranašumą prieš žmogų – jis gali dirbti be pertraukų. Kai žmogui reikia pamiegoti, nueiti į tualetą ar pavalgyti, DI modelis ir toliau dirba – taip pat efektyviai ir taip pat greitai. Be to, turint pakankamus skaičiavimo išteklius, DI pagrindu veikiantys sprendimai gali atlikti užduotis greičiau, nei tai padarytų žmogus.
Tačiau vos tik pasikeitus produkcijai ar aplinkos sąlygoms, kompiuterinę sistemą adaptuoti gerokai sunkiau. Čia ir atsiskleidžia žmogaus privalumai – žmogus geba lengviau ir greičiau prisitaikyti prie pokyčių.
„Žmogaus regėjimo sistema evoliucionavo daugiau kaip 2 milijonus metų. Nemanau, kad šiuolaikinės kompiuterinės regos technologijos jau dabar gali būti tikslesnės nei žmogus. Bent kol kas“, – apibendrina KTU EEF profesorius Vidas Raudonis.

