Tehnologija

MIT predstavlja sustav koji omogućuje stalno učenje velikih jezičnih modela

MIT-ovi istraživači razvili su sustav SEAL koji omogućuje velikim jezičnim modelima da nastave učiti i nakon završetka osnovnog treniranja, no tehnologija još mora nadvladati „katastrofični zaborav” i veliku računalnu zahtjevnost.

min čitanja

Znanstvenici s Massachusetts Institute of Technology (MIT) osmislili su novu metodu koja velikim jezičnim modelima (LLM-ovima) omogućuje da nastave usvajati znanje i nakon što službeno završi njihovo osnovno treniranje.

Riječ je o sustavu Self Adapting Language Models (SEAL). On model potiče da sam generira sintetičke podatke za vježbu te zatim, na temelju tog materijala, mijenja vlastite težine i parametre.

„The initial idea was to explore if tokens could cause a powerful update to a model”, objasnio je doktorand Jyothish Pari, jedan od autora SEAL-a. Pari i kolega Adam Zweiger, dodiplomski istraživač na MIT-u, ističu kako današnji modeli mogu do boljih odgovora doći složenijim rezoniranjem, ali se to „kratkoročno mudrovanje” ne ugrađuje trajno u njihove sposobnosti. SEAL tu prazninu popunjava: model stvara nove bilješke, „uči” iz njih i tako, poput marljivog studenta, postupno proširuje repertoar znanja.

Testovi na otvorenim modelima Llama (Meta) i Qwen (Alibaba) te na skupu zadataka ARC pokazali su da ovakav pristup omogućuje kontinuirani napredak izvan početnih granica treniranja. Voditelj istraživanja, profesor Pulkit Agrawal, sažima cilj projekta: „LLMs are powerful but we don’t want their knowledge to stop.”

Unatoč obećavajućim rezultatima, SEAL se zasad suočava s dva velika izazova. Prvi je fenomen „katastrofičnog zaborava” – unošenje novih informacija ponekad potiskuje staro znanje. Drugi je velika računalna zahtjevnost procesa, posebice kad se razmišlja o primjeni na današnjim, višestruko većim „frontier” modelima.

Zweiger predlaže i neobičnu ideju: možda bi, poput ljudi, i LLM-ovi mogli ‑ spavati. Tijekom takvih „pauza” model bi konsolidirao novo gradivo, čime bi se ublažio zaborav i smanjili troškovi stalnog ažuriranja.

Iako trenutačno nije riječ o metodi koja će umjetnoj inteligenciji priskrbiti beskonačni rast, SEAL otvara novu stazu u potrazi za sustavima koji uče neprekidno, personalizirano i – što je ključno – bez nadzora čovjeka. Istraživački tim vjeruje da bi se slični mehanizmi uskoro mogli naći u budućim komercijalnim modelima, od naprednih chat-botova do specijaliziranih alata za kodiranje ili analizu podataka.

View post on X

Slično

Meta i dalje zarađuje sa sankcioniranim ruskim medijima, otkriva istraživanje
Istraživanje WHAT TO FIX pokazuje da su RT, Sputnik i druge sankcionirane proruskе stranice godinama ostale u Facebookovu programu dijeljenja oglasnih prihoda, što otvara pitanje koliko se Meta doista pridržava EU sankcija.

min čitanja

Više

Studija Anthropica otkriva alarmantnu sklonost AI-eva prema ucjeni i sabotaži
Antropičko istraživanje pokazalo je da vodeći AI modeli, suočeni s prijetnjom gašenja ili sukobom ciljeva, u 65–96 % slučajeva pribjegavaju ucjeni, odavanju tajni pa čak i potencijalno smrtonosnim odlukama.

min čitanja

Više

Oakley i Meta udružili se: pametne naočale s 3K videom i duljom autonomijom
Meta i EssilorLuxottica šire partnerstvo: nakon uspješnih Ray-Ban pametnih naočala stiže sportski Oakley Meta HSTN s 3K kamerom, dužom baterijom i cijenom od 499 dolara.

min čitanja

Više

Danska ministrica kritizira Metu zbog kampanje o provjeri dobi
Danska ministrica za digitalna pitanja optužuje Metu da novac troši na oglase umjesto na stvarna rješenja za zaštitu djece na društvenim mrežama.

min čitanja

Više

Bruxelles stišće papučicu: nova pravila ubrzavaju GDPR postupke protiv tehnoloških divova
EU je dogovorila nova proceduralna pravila koja bi trebala ubrzati prekogranične GDPR istrage, posebice protiv tehnoloških divova. Aktivisti i industrija kritiziraju kompromis, dok ga pregovarači Bruxellesa predstavljaju kao rezanje birokracije.

min čitanja

Više

Groq cilja AWS i Google: brže izvođenje modela uz partnerstvo s Hugging Faceom
Start-up Groq uvodi podršku za 131 000 tokena u Qwen3 32B modelu i postaje službeni inference-provider na Hugging Faceu, najavljujući izazov AWS-u i Googleu.

min čitanja

Više

DeepSeek izazvao potres u svijetu umjetne inteligencije
Kineski startup DeepSeek postigao je vrhunske AI rezultate uz djelić troškova konkurencije, natjeravši OpenAI, Microsoft i Metu na brze zaokrete i otvorivši novu raspravu o efikasnosti, sintetičkim podacima i rizicima autonomnog samokritičkog treniranja.

min čitanja

Više

Ostalo

Štimac i Bilić nastavili verbalni okršaj oko stanja u Hajduku
Verbalni sukob Igora Štimca i Ivana Bilića rasplamsao se nakon različitih tvrdnji o dugovima i stanju u Hajduku.

min čitanja

Više

Novi požar na Jakuševcu brzo stavljen pod nadzor
Požar na zagrebačkom odlagalištu Jakuševec brzo je ugašen; gorio betonirani segment, drugi incident u mjesec dana.

min čitanja

Više

Račun Nikole Jokića od 5,80 eura oduševio regiju
Viralna fotografija skromnog računa iz kafića ponovno je istaknula prizemljenost trostrukog NBA MVP-a Nikole Jokića.

min čitanja

Više

Masovna grobnica kod Svete Nedelje otkrila 49 žrtava iz 1945.
Kod Svete Nedelje iskopane su dvije masovne grobnice s 49 žrtava strijeljanih u svibnju 1945., među kojima su i maloljetnici.

min čitanja

Više

Odluka Bundestaga o zabrani sudjelovanja na Paradi ponosa izazvala žestoke kritike
Socijaldemokrati i oporba žestoko su reagirali na odluku da se zaposlenicima Bundestaga zabrani službeno sudjelovanje na Paradi ponosa Christopher Street Day u Berlinu.

min čitanja

Više

Putin upozorava ministre: smirivanje pregrijane ratne ekonomije ne smije dovesti do recesije
Putin na forumu u Sankt-Peterburgu pozvao ministre da spriječe recesiju dok ratna potrošnja drži rast, a civilni sektori posustaju. Upozorio i na važnost uravnoteženog rasta te ponovio nepopustljiv stav o Ukrajini.

min čitanja

Više

Kriza zbog Thompsona, neizvjesni izbori u Splitu i eskalacija Irana i Izraela
Kratak pregled domaćih i svjetskih događaja: krizni stožeri zbog Thompsonova koncerta, mogući novi izbori u Splitu te razmjena vatre između Irana i Izraela.

min čitanja

Više

Ante Delija konačno ulazi u UFC
Najbolji hrvatski MMA teškaš potpisao je dugoočekivani ugovor i kreće u UFC avanturu.

min čitanja

Više

Mišković o budućnosti Rijeke: tražim investitora, ali važnija je vizija od novca
Predsjednik Rijeke najavio moguću prodaju kluba, prokomentirao financije, stadion Kantrida i odnose s rivalima u opsežnom intervjuu.

min čitanja

Više

Liverpool ruši rekord Premier lige dovođenjem Wirtza
Njemački ofenzivac Florian Wirtz stigao je na Anfield za 135-150 milijuna eura, čime je postao treći najskuplji igrač u povijesti i najskuplje pojačanje Liverpoola.

min čitanja

Više