Kinijos mokslininkai sukūrė didelę 3D veidų duomenų bazę ir naują dirbtinio intelekto modelį, leidžiantį robotams nustatyti pagrindinius veido taškus nenaudojant 2D vaizdų ar skaitmeninių šablonų. Toks sprendimas humanoidiniams robotams padeda natūraliau atpažinti žmones, tiksliau perteikti emocijas ir sklandžiau sąveikauti.
Sistemą sukūrė profesoriaus Songo Zhango komanda iš Kinijos mokslų akademijos Šendženo Pažangiųjų technologijų instituto kartu su daktaro Ye Yupino vadovaujamais tyrėjais iš Fudziano technologijos universiteto. Mokslininkai parengė sprendimą, leidžiantį rinkti 3D ir 4D veido duomenis, o vėliau suformavo duomenų bazę iš maždaug 200 tūkstančių itin tikslių 3D skenų.
Duomenų bazėje sukaupti įvairių veido išraiškų skenai, veido orientyrai, itin tikslūs viso kūno 3D modeliai ir dinamiškos 4D veido išraiškos. Šis rinkinys taip pat buvo atrinktas į Fudziano provincijos programą „Aukštos kokybės DI duomenys 2025“.
Vietoje įprastų metodų, paremtų tekstūruotais vaizdais, tyrėjai sukūrė CF-GAT tinklą, kuris apdoroja vadinamuosius taškų debesis – koordinačių rinkinius, aprašančius veido geometriją be tekstūrų. Modelis sutelkia dėmesį į vietines formos detales ir kartu įvertina bendruosius veido struktūros ryšius, todėl geriau atsparus triukšmui ir tiksliau nustato smulkias ypatybes.
Bandymai parodė, kad CF-GAT geriau prisitaiko prie skirtingų veido formų ir tiksliau identifikuoja pagrindinius veido taškus. Tai ypač svarbu kuriant realistiškas veido išraiškas ir užtikrinant tikslų judesių sekimą. Tyrimo rezultatai patvirtina, jog dideli ir detalūs realių duomenų rinkiniai reikšmingai pagerina algoritmų veikimą.
Tyrėjų teigimu, ši technologija gali padaryti humanoidinius robotus gerokai natūralesnius, patikimesnius ir „žmogiškesnius“. Be to, ji gali būti plačiai pritaikoma biometrinio atpažinimo sistemose ir virtualiuose avataruose, naudojamuose pramogų industrijoje, sveikatos priežiūroje bei paslaugų sektoriuje.

