„Anthropic“ išleido naują dirbtinį intelektą: jo galias teko suvaržyti dėl saugumo
JAV bendrovė „Anthropic“ pristatė naują bendro naudojimo dirbtinio intelekto modelį „Fable 5“, kurį pati įvardija kaip sąmoningai apribotą savo pažangiausios „Mythos“ krypties versiją. Sprendimas priimtas augant diskusijoms, kaip viešai diegti itin galingus DI įrankius, kad jie nebūtų lengvai pritaikomi kenkėjiškiems veiksmams.
Pasak „Anthropic“, „Fable 5“ išlaiko aukštą bendrą našumą, tačiau jautrios sritys, tokios kaip kibernetinis saugumas ar biologija, apdorojamos per mažiau pajėgų modelį „Opus 4.8“. Tokiu būdu įmonė siekia sumažinti tikimybę, kad vartotojai išgaus instrukcijas kibernetinėms atakoms ar kitoms pavojingoms veikloms.
„Tokio pajėgumo modelio išleidimas kelia rizikų. Be saugiklių, „Fable 5“ gebėjimai, pavyzdžiui, kibernetinio saugumo srityje, galėtų būti panaudoti padaryti rimtą žalą“, – teigė „Anthropic“.
Kartu bendrovė paskelbė ir apie „Claude Mythos 5“ atnaujinimą, kuris iki šiol buvo pasiekiamas tik ribotam ratui organizacijų. Ši prieiga siejama su programa „Project Glasswing“, orientuota į kritinės infrastruktūros saugos stiprinimą ir pažeidžiamumų paiešką dar iki platesnio modelių prieinamumo.
„Anthropic“ teigimu, „Fable 5“ remiasi ta pačia pagrindine architektūra kaip ir „Mythos“, tačiau viešajam naudojimui taikomi griežtesni ribojimai. Tuo metu dalyviai, dirbantys su „Project Glasswing“, gali turėti platesnes galimybes, nes jų naudojimo scenarijai labiau kontroliuojami ir nukreipti į gynybą.
Įmonė taip pat signalizuoja ketinanti plėsti prieigą prie „Mythos“ modelių, nes konkurencija tarp JAV kūrėjų dėl pažangiausių sprendimų aštrėja. Paraleliai stiprėja ir politinis spaudimas: pastaraisiais mėnesiais JAV vis aktyviau svarsto, kaip užtikrinti, kad naujos kartos DI įrankiai stiprintų kibernetinę gynybą, bet kartu nebūtų lengvai pritaikomi piktnaudžiavimui.
Rizikų tema aktuali ne vien „Anthropic“: pažangūs modeliai jau dabar naudojami automatizuotai analizuoti programinį kodą, aptikti klaidas ir vertinti konfigūracijas. Tačiau tos pačios funkcijos gali būti nukreiptos ir į silpnų vietų paiešką, todėl dalis bendrovių renkasi vadinamąjį diferencijuotą prieigos modelį, kai jautresnės galimybės atveriamos tik patikrintiems partneriams.
„Anthropic“ sprendimas išleisti mažiau galingą „Fable 5“ versiją rodo bandymą suderinti du tikslus: išlaikyti rinkai patrauklų, našų DI įrankį ir kartu apriboti scenarijus, kurie galėtų kelti grėsmę kibernetiniam saugumui. Artimiausiu metu rinka stebės, ar tokie saugikliai iš tiesų veiksmingi praktikoje ir kaip greitai bus plečiama prieiga prie „Mythos 5“.
Sekite mūsų naujienas patogiau
- Pridėkite mus kaip mėgstamiausią šaltinį „Google Discover“, kad nepraleistumėte svarbiausių naujienų.
- Taip pat galite mus nustatyti kaip pageidaujamą šaltinį „Google“ paieškoje.
