Laikas.ltLaikas.lt
  • Naujausios
  • Lietuva
  • Pasaulis
  • Kultūra
  • Technologijos
  • Mokslas
  • Auto
  • Maistas
  • Sveikata
Paieška
Naujienos
  • Lietuva
  • Pasaulis
  • Mokslas
  • Technologijos
  • Automobiliai
Gyvenimas
  • Maistas
  • Namai
  • Sodas ir daržas
  • Sveikata ir grožis
Daugiau
  • Horoskopai
  • Kultūra
Redakcija
  • Apie mus
  • Autoriai
  • Privatumo politika
  • Redakcijos politika
  • Kontaktai
Laikas.ltLaikas.lt
  • Naujausios
  • Lietuva
  • Pasaulis
  • Kultūra
  • Technologijos
  • Mokslas
  • Auto
  • Maistas
  • Sveikata
Paieška
  • Naujienos
    • Naujausios
    • Lietuva
    • Pasaulis
    • Finansai
    • Technologijos
    • Automobiliai
    • Mokslas
  • Redakcija
    • Apie mus
    • Autoriai
    • Privatumo ir slapukų politika
    • Redakcijos politika
    • Kontaktai
Sekite mus
Pradinis puslapis » „Apple“ ir Kembridžas sukūrė dirbtinio intelekto teisėją, kuris faktus geba patikrinti geriau nei žmogus
Technologijos

„Apple“ ir Kembridžas sukūrė dirbtinio intelekto teisėją, kuris faktus geba patikrinti geriau nei žmogus

Paskelbė Jonas Vainius
2025-07-25, 09:00
Komentarų: 0
Dalintis
3 min. skaitymo

Dirbtinio intelekto tyrėjai vis dažniau naudoja didelius kalbos modelius tam, kad įvertintų kitų dirbtinio intelekto sistemų atsakymų kokybę. Šis procesas vadinamas „LLM kaip teisėjas“. Tačiau paaiškėjo, kad tokie vertinimai dažnai tampa netikslūs, kai reikia įvertinti sudėtingas užduotis, ilgos apimties tekstų tikslumą, pažangų programavimą ar matematines užduotis.

Norėdami tai išspręsti, Kembridžo universiteto ir „Apple“ tyrėjai sukūrė naują sistemą, kuri pagerina AI teisėjų sprendimų kokybę pasitelkdama papildomus patikros įrankius. Ši sistema padeda įveikti tiek žmonių, tiek AI ribotumus. Žmonės dažnai daro klaidas dėl nuovargio, laiko trūkumo ar pasikliauja rašymo stiliumi, o ne faktų tikslumu. Tuo tarpu AI modeliai sunkiai susidoroja su kompleksinėmis užduotimis be papildomos pagalbos.

Sukurtas vertinimo agentas veikia kaip savarankiškas sprendimų priėmėjas. Jis įvertina, ar konkrečiam atsakymui reikia naudoti papildomus įrankius, ir pasirenka tinkamiausią. Kiekvienas vertinimas vyksta trimis etapais, pradinė srities analizė, įrankių naudojimas ir galutinis sprendimas.

Tikrinant faktus, sistema naudoja interneto paiešką, kad patvirtintų ar paneigtų pavienes teiginių dalis. Kodo tikrinimui naudojamas „OpenAI“ kodo vykdymo modulis, leidžiantis realiai patikrinti, ar pateiktas kodas veikia. Matematinėms užduotims taikomas specializuotas matematinis tikrintuvas, skirtas aritmetinių skaičiavimų ir formulių tikslumui vertinti.

Jei agentas nustato, kad jokie įrankiai nepravers, jis grįžta prie įprasto AI vertintojo. Taip išvengiama bereikalingo skaičiavimo ir sumažinamos klaidos atliekant paprastas užduotis.

Pasiekti rezultatai ir poveikis vertinimo tikslumui

Sistema ypač pasiteisino tikrinant ilgos apimties faktinius atsakymus, ji parodė žymiai didesnį atitikimą su tikrais duomenimis nei baziniai vertinimo metodai. Programavimo užduotyse rezultatai taip pat pagerėjo visose palyginamosiose sistemose. Matematikos srityje rezultatai buvo mišrūs, kai kur pasiekti geresni rezultatai, tačiau bendra atitiktis siekė apie 56 procentus.

Ypač įdomu tai, kad ilguose tekstiniuose atsakymuose AI vertintojo sprendimai dažnai sutapo su tiesa dažniau nei žmonių vertinimai. Tai rodo, kad naujasis metodas ne tik konkurencingas, bet kai kuriais atvejais ir pranašesnis už žmogaus gebėjimą objektyviai įvertinti atsakymą.

Ateities galimybės ir plėtra

Ši sistema sukurta taip, kad ateityje būtų galima ją dar labiau tobulinti integruojant naujus įrankius. Tyrėjai planuoja atverti šaltinio kodą ir paviešinti jį „Apple“ „GitHub“ platformoje. Tai leis ir kitiems kūrėjams prisidėti prie sprendimų tobulinimo bei kurti dar tikslesnes dirbtinio intelekto vertinimo sistemas.

Nors AI dar netobulas, šis žingsnis rodo, kad technologijos gali ne tik kurti turinį, bet ir vis geriau vertinti, ką pačios sukūrė. Toks požiūris gali pakeisti tiek mokymosi, tiek testavimo, tiek dirbtinio intelekto plėtros būdus visame pasaulyje.

Temos:AktualuAppleDirbtinis intelektas
Kaip vertinate šį įrašą?
Nuostabus!0
Prajuokino0
Nustebino0
Nuvylė0
Sunervino!0
PaskelbėJonas Vainius
Žurnalistas
Rašau apie technologijas, skaitmeninį pasaulį ir inovacijas, domiuosi IT, dirbtiniu intelektu ir sprendimais, kurie keičia kasdienį gyvenimą. Savo tekstuose siekiu sudėtingas technologijų temas pateikti aiškiai ir suprantamai, kad skaitytojai galėtų lengvai orientuotis sparčiai besikeičiančioje technologijų aplinkoje.
Komentarų: 0

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Rekomenduojami Video

Rekomenduojame perskaityti

brown metal tower
Pasaulis

Lavrovo pareiškimas kelia klausimų: kuo „Nord Stream“ iš tikrųjų toks reikšmingas?

2026-03-29
Snow-covered birch trees in a winter forest in Jönköping, Sweden, with colorful birdhouses.
Maistas

Ar jau spėjote atsigerti beržų sulos? Prieš dar vieną stiklinę verta žinoti šią itin svarbią informaciją

Aurimas Kavaliūnas
2026-03-29
Kultūra

Paprasti sprendimai, kaip prižiūrėti vonios kambarį, kad nesikauptų muilo ir kalkių dėmės

Ana Januliavičienė
2026-03-29
Kultūra

Bukšpano gaivinimas pavasarį: esminiai žingsniai ir patarimai, kada ir kaip teisingai kirpti

Ana Januliavičienė
2026-03-29
Kultūra

Dažniausios lieknėjimo kliūtys: dietologai atskleidžia, kas trukdo pasiekti norimų rezultatų

Ana Januliavičienė
2026-03-29
Robertas Kaunas. ELTA / Dainius Labutis nuotr.
Lietuva

Ar esame pasiruošę tik teoriškai: susitarimas su Ukraina verčia abejoti Lietuvos gynybos stiprumu

2026-03-29

Laikas.lt – įdomus ir gyvas portalas, skirtas visiems, mėgstantiems patikimą informaciją ir naudingus patarimus, paversiančius kasdienį gyvenimą lengvesniu. Skaitykite ir mėgaukitės!

TIPRO, UAB
Kalvarijų g. 99A-33, LT-08219 Vilnius
Tel.: +370 606 17737
El. paštas: [email protected]

Mūsų populiariausios

  • Sveikata ir grožis
  • Technologijos
  • Kultūra
  • Namai
  • Mokslas
  • Pasaulis

Taip pat skaitykite

  • Automobiliai
  • Horoskopai
  • Receptai
  • Maistas
  • Ekonomika
  • Regionai

Redakcija

  • Apie mus
  • Autoriai
  • Privatumo politika
  • Redakcijos politika
  • Kontaktai
Laikas.ltLaikas.lt
@ 2026 Visos teisės saugomos
  • Titulinis
  • Privatumo ir slapukų politika
  • Redakcijos politika
  • Kontaktai
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?

Not a member? Sign Up