Laikas.ltLaikas.lt
  • Naujausios
  • Lietuva
  • Pasaulis
  • Žmonės
  • Gyvenimas
  • Maistas
  • Auto
  • Horoskopai
  • Pramogos
Paieška
Naujienos
  • Lietuva
  • Pasaulis
  • Gyvenimas
  • Mokslas
  • Technologijos
  • Automobiliai
Gyvenimas
  • Mada
  • Maistas
  • Namai
  • Sodas ir daržas
  • Sveikata ir grožis
  • Žmonės
Daugiau
  • Horoskopai
  • Receptai
  • Pramogos
  • Kinas
  • Menas
  • Renginiai
Redakcija
  • Apie mus
  • Autoriai
  • Privatumo politika
  • Redakcijos politika
  • Kontaktai
Laikas.ltLaikas.lt
  • Naujausios
  • Lietuva
  • Pasaulis
  • Žmonės
  • Gyvenimas
  • Maistas
  • Auto
  • Horoskopai
  • Pramogos
Paieška
  • Naujienos
    • Naujausios
    • Pasaulis
    • Lietuva
    • Mokslas
    • Automobiliai
    • Technologijos
  • Gyvenimas
    • Mada
    • Maistas
    • Namai
    • Sodas ir daržas
    • Sveikata ir grožis
    • Žmonės
  • Įdomybės
    • Horoskopai
    • Receptai
  • Pramogos
    • Kinas
    • Menas
    • Renginiai
    • Eurovizija 2026
  • Redakcija
    • Apie mus
    • Autoriai
    • Privatumo ir slapukų politika
    • Redakcijos politika
    • Kontaktai
Sekite mus
Pradinis puslapis » Dirbtinio intelekto mokymas gali smarkiai atpigti: MIT siūlo gudrų būdą išnaudoti skaičiavimus
Technologijos

Dirbtinio intelekto mokymas gali smarkiai atpigti: MIT siūlo gudrų būdą išnaudoti skaičiavimus

Paskelbė Jonas Vainius
2026-03-15, 05:35
Komentarų: 0
Dalintis
3 min. skaitymo

Didelių kalbinių modelių mokymas kainuoja itin brangiai. Svarbu ne tik turėti daug grafinių procesorių (GPU), bet ir kuo efektyviau juos išnaudoti. Didėjant modelių mastui, net ir menki neefektyvumo šaltiniai virsta milžiniškomis laiko bei energijos sąnaudomis.

Mokslininkų komanda iš MIT, bendradarbiaudama su partneriais, tokiais kaip „NVIDIA“, teigia radusi praktišką būdą susigrąžinti mokymo metu švaistomus skaičiavimus. Kai kuriais atvejais jiems pavyko bendrą mokymo laiką sutrumpinti beveik perpus.

Tikslinė problema slypi pastiprinamajame mokymesi (angl. reinforcement learning, RL), ypač vadinamojoje „išvyniojimo“ (angl. rollout) fazėje. Tai etapas, kai modelis sugeneruoja kelis galimus atsakymo variantus, kad „išmoktų“, koks elgesys veda prie geresnių rezultatų. Ši fazė itin svarbi loginio mąstymo ir samprotavimo gebėjimus lavinantiems LLM, tačiau ji yra labai lėta.

„Išvyniojimo“ fazė gali sudaryti net iki 85 % viso vykdymo laiko. Pagrindinė priežastis – vadinamoji „ilgosios uodegos“ pasiskirstymo (angl. long-tail distribution) problema: dauguma sugeneruotų atsakymų baigiami greitai, tačiau nedidelė jų dalis būna gerokai ilgesnė už vidurkį. Kadangi GPU turi sinchronizuotis, greičiau baigiantys skaičiavimus dažnai priversti „dykinėti“, laukdami vėluojančiųjų.

MIT komandos pasiūlytas sprendimas, pavadintas „Taming the Long Tail“ (TLT), tiesiogiai mažina šį švaistymą. Vietoje to, kad GPU liktų neveiklūs, kol generuojami itin ilgi atsakymai, TLT šį laiką panaudoja lengvo, „juodraštinio“ (angl. draft) modelio mokymui. Šis mažesnis modelis nuolat treniruojamas „skubos tvarka“ tuo pačiu metu, kai mokomas pagrindinis modelis.

Idėja remiasi spekuliatyviu dekodavimu (angl. speculative decoding) – technika, kai mažesnis modelis iš anksto prognozuoja kelis galimus ženklius (tokenus), o pagrindinis modelis juos vėliau lygiagrečiai patikrina. Tačiau tradicinis spekuliatyvus dekodavimas remiasi iš anksto fiksuotu „juodraštiniu“ modeliu, kuris pastiprinamojo mokymosi metu greitai pasensta, nes pagrindinis modelis nuolat kinta.

TLT pakeičia šią dinamiką. Mokydama „juodraštinį“ modelį tada, kai atsiranda proga, ir panaudodama resursus, kurie kitu atveju būtų nenaudojami, sistema užtikrina, kad mažesnis modelis išliktų suderintas su pagrindiniu. Tai pasiekiama nereikalaujant papildomo, specialiai tam skirto skaičiavimo laiko.

Atlikus bandymus su keliais loginį samprotavimą akcentuojančiais LLM ir realiais duomenų rinkiniais, rezultatai pasirodė įspūdingi. Tyrėjai fiksavo bendro mokymo paspartėjimą nuo 70 % iki 210 %, lyginant su stipriais atskaitos metodais. Daugeliu atvejų tai reiškia maždaug dvigubai greitesnį mokymą, o modelių tikslumas išliko nepakitęs.

Yra ir įdomi papildoma nauda: nuolat mokomas „juodraštinis“ modelis gali tapti vertingu galutiniu produktu. Kadangi jis treniruojamas kartu su pagrindiniu modeliu, tam tikromis aplinkybėmis jį galima panaudoti kaip efektyvų modelį išvedimui (angl. inference), kai reikia greitesnio ir pigesnio užklausų apdorojimo.

Šis darbas atskleidžia platesnę dabartinių dirbtinio intelekto tyrimų tendenciją – orientaciją į optimizavimą, o ne į aklą „žaliąją jėgą“. Užuot be galo didinus skaičiavimo klasterių apimtį, vis dažniau ieškoma būdų maksimaliai išspausti našumą iš jau turimos aparatūros.

Jei tokie metodai kaip TLT pasiteisins pramoniniu mastu, jie gali reikšmingai sumažinti tiek finansines, tiek aplinkosaugines sąnaudas, susijusias su naujos kartos loginio samprotavimo modelių mokymu.

Kaip vertinate šį įrašą?
Nuostabus!0
Prajuokino0
Nustebino0
Nuvylė0
Sunervino!0
PaskelbėJonas Vainius
Žurnalistas
Rašau apie technologijas, skaitmeninį pasaulį ir inovacijas, domiuosi IT, dirbtiniu intelektu ir sprendimais, kurie keičia kasdienį gyvenimą. Savo tekstuose siekiu sudėtingas technologijų temas pateikti aiškiai ir suprantamai, kad skaitytojai galėtų lengvai orientuotis sparčiai besikeičiančioje technologijų aplinkoje.
Komentarų: 0

Parašykite komentarą Atšaukti atsakymą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Rekomenduojami Video

Rekomenduojame perskaityti

Automobiliai

Inžinieriai priartėjo prie beveik maksimalios ribos: naujas elektrinis variklis pribloškė technologijų pasaulį

Aurimas Kavaliūnas
2026-03-15
Lietuva

Seime atmesta iniciatyva dėl LRT finansavimo: kodėl šis siūlymas sukėlė tiek triukšmo?

2026-03-15
disposal, dump, garbage, junk, landfill, litter, pile, scrap metal, scrapyard, trash, waste, garbage, garbage, garbage, garbage, landfill, landfill, landfill, trash, trash, trash, trash, trash, waste, waste, waste
Įdomybės

Kazokiškių sąvartyne rimtas reikalavimas: aplinkosaugininkai pareikalavo skubiai nutraukti tai, kas vyksta

2026-03-15
Sodas ir daržas

Žolė tarp plytelių nebeataugs: sodininkai pataria, kuo verta pakeisti paprastą smėlį tarp trinkelių

Karolina Vasiliauskaitė
2026-03-15
Mokslas

Vienas signalas tarp tūkstančių: mokslininkai Marse aptiko galimą atmosferinio žaibo pėdsaką

Karolis Vaickus
2026-03-15
Pasaulis

Įtampa dėl naftos kelių neslūgsta: JAV prabilo apie kariuomenės pasirengimą lydėti tanklaivius

2026-03-15

Laikas.lt – įdomus ir gyvas portalas, skirtas visiems, mėgstantiems patikimą informaciją ir naudingus patarimus, paversiančius kasdienį gyvenimą lengvesniu. Skaitykite ir mėgaukitės!

TIPRO, UAB
Kalvarijų g. 99A-33, LT-08219 Vilnius
Tel.: +370 606 17737
El. paštas: [email protected]

Mūsų populiariausios

  • Namai
  • Sveikata ir grožis
  • Receptai
  • Mokslas
  • Pasaulis
  • Pramogos
  • Žmonės

Taip pat skaitykite

  • Automobiliai
  • Horoskopai
  • Lietuva
  • Maistas
  • Patarimai
  • Ekonomika
  • Regionai

Redakcija

  • Apie mus
  • Autoriai
  • Privatumo politika
  • Redakcijos politika
  • Kontaktai
Laikas.ltLaikas.lt
@ 2026 Visos teisės saugomos
  • Titulinis
  • Privatumo ir slapukų politika
  • Redakcijos politika
  • Kontaktai
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?