Dirbtinis intelektas ir humanoidinė robotika sparčiai tobulėja, o naujausias Kolumbijos universiteto inžinierių sukurtas robotas EMO parodo, kaip arti esame realistiško bendravimo su mašinomis. Šis robotas mokėsi judinti lūpas stebėdamas save veidrodyje ir analizuodamas internete esančius vaizdo įrašus. Dabar jis geba įtikinamai atkartoti žmogaus kalbą ir dainavimą.
Kolumbijos universiteto komanda sukūrė inovatyvų robotą EMO, kuris itin tiksliai atkuria sudėtingus žmogaus lūpų judesius, įskaitant smulkiausius artikuliacijos niuansus. Pasitelkdamas dirbtinį intelektą, robotas savarankiškai išmoko sinchronizuoti veido mimiką su kalbos garsais ir net dainavimu, nereikalaudamas iš anksto parengtų scenarijų.
Toks technologinis proveržis laikomas svarbiu žingsniu link natūralesnio žmogaus ir roboto dialogo, kuriame svarbi ne tik žodžių prasmė, bet ir tai, kaip jie ištariami.
Kaip robotas mokėsi šypsotis ir artikuliuoti žodžius?
Skirtingai nei tradiciniai robotai, kurių „žandikaulis“ dažniausiai tik atsiveria ir užsiveria, EMO turi minkštas silikonines lūpas. Po dirbtine „oda“ įrengti 26 varikliukai, suteikiantys 10 laisvės laipsnių ir leidžiantys atkurti subtilius lūpų bei veido judesius.
Mokymosi procesas prasidėjo nuo savęs stebėjimo veidrodyje: robotas eksperimentavo su veido išraiškomis panašiai kaip mažas vaikas, tyrinėjantis savo atspindį. Vėliau sistema analizavo tūkstančius valandų vaizdo įrašų, kuriuose žmonės kalba ir dainuoja, kad suprastų ryšį tarp skleidžiamo garso ir atitinkamų veido raumenų judesių.
Taip EMO išmoko susieti konkrečius garsus ir žodžius su tam tikromis lūpų bei veido padėtimis, todėl jo kalbėjimas atrodo gerokai natūralesnis nei ankstesnių humanoidinių robotų.
„Šiurpiosios slėnio“ efektą bandoma įveikti mimika
Ilgą laiką bandymai kurti į žmogų panašius robotus susidurdavo su vadinamuoju „šiurpiosios slėnio“ efektu: kai robotas atrodo beveik kaip žmogus, tačiau menki netikslumai mimikoje ar judesiuose žiūrovams sukelia diskomfortą, nerimą ar net baimę.
Vienas dažniausių trikdžių buvo nenatūralus veido judesių ir kalbos sinchronizavimas. Lūpos tarsi „nespėdavo“ paskui garsą, trūkdavo įprastų mikrojudesių, šypsenos niuansų, aiškios artikuliacijos kalbos pradžioje ir pabaigoje.
EMO kūrėjų teigimu, itin tikslus lūpų ir veido judesių atkūrimas, kartu su tiksliu jų suderinimu su kalba, padeda sumažinti šį efektą ir palengvina emocinio ryšio kūrimą tarp žmogaus ir roboto. Jie taip pat pabrėžia, kad sujungus tokią mimikos technologiją su didžiaisiais kalbos modeliais galima pasiekti naują žmogaus ir mašinos bendravimo lygį.
Kuo daugiau robotas bendraus su žmonėmis, tuo tiksliau jis gebės perteikti ne tik žodžius, bet ir emocines išraiškas: šypseną, nuostabą, susirūpinimą. Tai galėtų padaryti jį natūralesniu pašnekovu, tinkamu naudoti švietime, paslaugų sektoriuje, terapijoje ar pagalbos srityse.
Dirbtinis intelektas mokosi atpažinti ne tik žmones
Humanoidinių robotų pažanga yra tik viena iš daugelio sričių, kuriose šiandien taikomas dirbtinis intelektas. Pavyzdžiui, Šveicarijos ir JAV mokslininkai sukūrė sistemą „PoseSwin“, veikiančią panašiu principu kaip veido atpažinimo technologijos. Ji leidžia atskirti atskirus meškų individus pagal jų snukio bruožus.
Toks pritaikymas rodo, kad dirbtinis intelektas tampa vis tikslesnis ir lankstesnis: jis gali ne tik analizuoti tekstus ar vaizdus, bet ir suprasti sudėtingus judesius bei fizines išraiškas tiek žmonių, tiek gyvūnų pasaulyje.

