Po šio tyrimo internete pasitikėti taps dar sunkiau: DI jau tapo beveik neatpažįstamas

2026-05-24, 17:24 3 min. skaitymo 0

Dirbtinis intelektas pirmą kartą gavo tvirtų empirinių įrodymų, kad gali įveikti vadinamąjį Tiuringo testą. Kalifornijos universiteto San Diege mokslininkų tyrime „OpenAI“ modelis GPT-4.5 dažnai buvo palaikytas žmogumi, nors dalyvavo kaip kompiuterinė sistema.

Klasikiniame Tiuringo testo variante teisėjas tuo pačiu metu raštu bendrauja su dviem paslėptais dalyviais: žmogumi ir programa. Jei teisėjas patikimai neatskiria, kuris yra žmogus, laikoma, kad sistema sugebėjo įtikinamai imituoti žmogaus bendravimą.

Kas nustatyta tyrime

Tyrimas paskelbtas 2026 metais gegužės 19 dieną mokslo žurnale Proceedings of the National Academy of Sciences. Eksperimente dalyvavo dvi respondentų grupės: UC San Diego studentai ir platformoje „Prolific“ atrinkti žmonės iš įvairių šalių.

Po maždaug 5 minučių pokalbio GPT-4.5, gavęs specialiai parengtą instrukciją, buvo priskirtas žmogui 73 proc. atvejų. „Meta“ didelis kalbos modelis LLaMa-3.1-405B pasiekė 56 proc. ir statistiškai tapo sunkiai atskiriamas nuo realių pašnekovų.

Esminis veiksnys buvo vadinamoji promptų inžinerija, kai modeliui iš anksto nurodoma laikytis konkretaus „žmogiško“ bendravimo stiliaus. Be šių instrukcijų rezultatai smuko iki 36 proc. GPT-4.5 atveju ir 38 proc. LLaMa-3.1-405B atveju.

Kodėl tai svarbu

Tiuringo testas vertina ne žinių kiekį ar skaičiavimo tikslumą, o gebėjimą elgtis kaip žmogui pokalbyje. Tyrėjai pabrėžia, kad sėkmei svarbus ne tik taisyklingumas, bet ir natūrali kalbėsena, humoras, abejonės, net menkos klaidos.

Replikaciniame eksperimente, kai pokalbis truko apie 15 minučių, su tais pačiais „žmogiško vaidmens“ nurodymais modeliai išlaikė aukštus rodiklius. Tyrimo autoriai atkreipė dėmesį, kad studentai dažniau taikė vietinį kultūrinį kontekstą ir taip šiek tiek geriau aptiko, kada pašnekovas nėra žmogus.

Augančios rizikos internete

Tokie rezultatai stiprina diskusiją apie vadinamųjų padirbtų žmonių erą, kai paskyros, komentarai ar privatūs pokalbiai gali atrodyti visiškai autentiški. Praktinė pasekmė paprasta: daugėja situacijų, kai vartotojai nebegali būti tikri, kas yra kitoje ekrano pusėje.

„Turime būti atsargesni: bendraudami su nepažįstamais internete žmonės turėtų mažiau pasitikėti, kad kalba su žmogumi, o ne su dideliu kalbos modeliu“, – sakė tyrimo autorius Cameronas Jonesas.

Ekspertai sieja tai su didesne sukčiavimo, socialinės inžinerijos ir dezinformacijos rizika. Kai dirbtinis intelektas geba įtikinamai palaikyti dialogą, jam lengviau išgauti jautrią informaciją, kurstyti konfliktus komentaruose ar imituoti realius asmenis, ypač jei auditorija neturi aiškių patikros priemonių.

Tyrėjai tikisi, kad publikacija paskatins ir akademines diskusijas, ir praktinius sprendimus, įskaitant aiškesnį turinio žymėjimą bei priemones, kurios padėtų platformoms aptikti automatizuotą manipuliaciją. Kartu pabrėžiama, kad technologijoms sparčiai tobulėjant vien techninių filtrų gali nepakakti, todėl svarbi ir vartotojų skaitmeninė higiena.

Sekite mūsų naujienas patogiau

Pridėkite mus kaip mėgstamiausią šaltinį „Google Discover“, kad nepraleistumėte svarbiausių naujienų.
Taip pat galite mus nustatyti kaip pageidaujamą šaltinį „Google“ paieškoje.

Pridėti kaip pageidaujamą šaltinį

Temos: Dezinformacija Dirbtinis intelektas GPT-4.5 Llama Meta OpenAI Tiuringo testas

Šaltiniai:

Viktoras Baliulis

Rašau apie technologijas ir automobilius. Domiuosi naujausiomis inovacijomis, transporto tendencijomis ir sprendimais, kurie keičia mūsų kasdienybę. Siekiu sudėtingas temas pateikti aiškiai ir įdomiai, kad jos būtų suprantamos kiekvienam skaitytojui.