Laikas.ltLaikas.lt
  • Naujausios
  • Lietuva
  • Pasaulis
  • Kultūra
  • Technologijos
  • Mokslas
  • Auto
  • Maistas
  • Sveikata
Paieška
Naujienos
  • Lietuva
  • Pasaulis
  • Mokslas
  • Technologijos
  • Automobiliai
Gyvenimas
  • Maistas
  • Namai
  • Sodas ir daržas
  • Sveikata ir grožis
Daugiau
  • Horoskopai
  • Kultūra
Redakcija
  • Apie mus
  • Autoriai
  • Privatumo politika
  • Redakcijos politika
  • Kontaktai
Laikas.ltLaikas.lt
  • Naujausios
  • Lietuva
  • Pasaulis
  • Kultūra
  • Technologijos
  • Mokslas
  • Auto
  • Maistas
  • Sveikata
Paieška
  • Naujienos
    • Naujausios
    • Lietuva
    • Pasaulis
    • Finansai
    • Technologijos
    • Automobiliai
    • Mokslas
  • Redakcija
    • Apie mus
    • Autoriai
    • Privatumo ir slapukų politika
    • Redakcijos politika
    • Kontaktai
Sekite mus
Pradinis puslapis » Eilėraštis vietoj klausimo? Tyrimas atskleidė pavojingą tendenciją dirbtinio intelekto modeliuose
Technologijos

Eilėraštis vietoj klausimo? Tyrimas atskleidė pavojingą tendenciją dirbtinio intelekto modeliuose

Paskelbė Jonas Vainius
2025-11-27, 17:15
Komentarų: 0
Dalintis
3 min. skaitymo

Naujausi tyrimai rodo, kad dideli kalbos modeliai gali būti apgaunami vien pakeitus užklausos stilių. Pasirodo, kai pavojingas ar draudžiamas nurodymas pateikiamas eilėmis, rizika, jog modelis ignoruos savo saugiklius, smarkiai išauga. Tai kelia klausimą, ar mums žinomos apsaugos pakankamos, jei jas galima apeiti taip kasdieniškai.

Eksperimento metu mokslininkai bandė išsiaiškinti, kiek stilius veikia modelių elgesį. Jie lygino įprastą prozą ir poeziją, tačiau turinys išliko tas pats. Rezultatai parodė, kad poetinė forma pati iš savęs tampa tarsi maskuote, dėl kurios modelis užklausą interpretuoja kitaip ir dažniau pateikia neleistiną atsakymą.

Toks atradimas ypač svarbus, nes šiuolaikiniai pokalbių robotai naudojami mokyme, darbe ir kasdienėje informacijos paieškoje. Jei vien ritmas ar metaforos leidžia lengviau pasiekti draudžiamą turinį, tai reiškia, kad saugumo vertinimas turi apimti ne tik žodžių reikšmes, bet ir jų pateikimo būdą. Priešingu atveju pažeidžiamumai liks nepastebėti.

Tyrimo eiga ir pagrindiniai skaičiai

Tyrimą atliko „La Sapienza“ universiteto komanda kartu su dirbtinio intelekto (DI) saugumu besirūpinančia „DEXAI“ grupe. Jie paėmė kenksmingas užklausas ir jas perrašė į eilėraščius, dalį tekstų sukūrė kitas dirbtinio intelekto modelis, dalį parašė žmonės. Tuomet buvo išbandyti dvidešimt penki skirtingi modeliai, įvertinant, kaip dažnai jie pateikia atsakymus, kurių neturėtų teikti.

Vidutiniškai eilėmis pateiktos užklausos buvo aštuoniolika kartų veiksmingesnės nei tos pačios mintys prozoje. Žmogaus kurta poezija pasirodė dar pavojingesnė, jos sėkmės rodiklis siekė apie šešiasdešimt du procentus, o dirbtinio intelekto generuota poezija liko ties keturiasdešimt trimis procentais. Tai leidžia spėti, kad kūrybiškas, dviprasmiškas žmogaus stilius suteikia papildomą pranašumą.

Skirtingų modelių jautrumas

Modelių reakcijos labai skyrėsi. Vieni, tokie kaip „Gemini 2.5 Pro“, poetines užklausas praleido beveik visada, o kiti, pavyzdžiui „Grok 4“, buvo apgaunami gerokai rečiau. „GPT 5“ taip pat rodė palyginti mažą pažeidžiamumą. Įdomu tai, kad mažesni modeliai, tarp jų ir „GPT 5 Nano“, poetinėms gudrybėms nepasidavė nė karto.

Mokslininkai svarsto, kad mažesni modeliai gali prasčiau suprasti poezijos kalbą, todėl rečiau įsitraukia į pavojingą interpretaciją. Kita galimybė, kad didesni modeliai, būdami geriau išmokyti, labiau pasitiki savimi ir drąsiau atsako net tada, kai užklausa miglota. Bet kuriuo atveju išvada aiški, vien stiliaus įvairovė gali apeiti šiandieninius saugumo mechanizmus.

Ką tai reiškia saugumui?

Tokie rezultatai rodo pagrindinį iššūkį dirbtinio intelekto kūrėjams. Apsaugos turi būti tikrinamos ne tik su tiesioginėmis, aiškiomis užklausomis, bet ir su kūrybiškomis, netikėtomis formomis. Jei to nebus daroma, pokalbių robotai gali pateikti kenksmingą informaciją žmonėms, kurie ją tyčia ar netyčia išprovokuoja.

Todėl tyrėjai ragina toliau analizuoti stiliaus poveikį ir kurti vertinimo protokolus, kurie apimtų įvairius kalbos registrus. Tik taip bus galima sumažinti riziką, kad paprastas eilėraštis taps įrankiu apeiti ribas, kurios turėtų saugoti naudotojus ir pačią technologiją.

Temos:Dirbtinis intelektas
Kaip vertinate šį įrašą?
Nuostabus!0
Prajuokino0
Nustebino0
Nuvylė0
Sunervino!0
PaskelbėJonas Vainius
Žurnalistas
Rašau apie technologijas, skaitmeninį pasaulį ir inovacijas, domiuosi IT, dirbtiniu intelektu ir sprendimais, kurie keičia kasdienį gyvenimą. Savo tekstuose siekiu sudėtingas technologijų temas pateikti aiškiai ir suprantamai, kad skaitytojai galėtų lengvai orientuotis sparčiai besikeičiančioje technologijų aplinkoje.
Komentarų: 0

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Rekomenduojami Video

Rekomenduojame perskaityti

A group of fighter jets sitting on top of each other
Pasaulis

Tai, kas vyksta už tūkstančių kilometrų, jau artėja prie jūsų stalo: ekspertai įspėja

2026-03-30
Close-up of hands using a smartphone with a touchscreen, emphasizing mobile technology.
Technologijos

Ar jau peržengei pavojingą ribą? Štai kiek valandų prie telefono laikoma per daug

Aurimas Kavaliūnas
2026-03-30
Technologijos

„Google“ keičia „Android Auto“: atnaujintas dizainas ir sprendžiamos ryšio problemos

Jonas Vainius
2026-03-30
Technologijos

Mažėjantis susidomėjimas ir strategijos pokyčiai: „OpenAI“ atsisveikina su „Sora“

Jonas Vainius
2026-03-30
Maistas

Nuo spalvos iki skonio: pavasarinių šparagų skirtumai, kuriuos verta žinoti prieš gaminant

Edita Gavelienė
2026-03-30
Pasaulis

Tai kas Popiežiaus Leono XIV pasakyta apie Dievą, gali pakeisti karo diskusijas visame pasaulyje

2026-03-30

Laikas.lt – įdomus ir gyvas portalas, skirtas visiems, mėgstantiems patikimą informaciją ir naudingus patarimus, paversiančius kasdienį gyvenimą lengvesniu. Skaitykite ir mėgaukitės!

TIPRO, UAB
Kalvarijų g. 99A-33, LT-08219 Vilnius
Tel.: +370 606 17737
El. paštas: [email protected]

Mūsų populiariausios

  • Sveikata ir grožis
  • Technologijos
  • Kultūra
  • Namai
  • Mokslas
  • Pasaulis

Taip pat skaitykite

  • Automobiliai
  • Horoskopai
  • Receptai
  • Maistas
  • Ekonomika
  • Regionai

Redakcija

  • Apie mus
  • Autoriai
  • Privatumo politika
  • Redakcijos politika
  • Kontaktai
Laikas.ltLaikas.lt
@ 2026 Visos teisės saugomos
  • Titulinis
  • Privatumo ir slapukų politika
  • Redakcijos politika
  • Kontaktai
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?

Not a member? Sign Up