CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

14. listopada 2025, 06:15

Novo američko istraživanje pokazalo kako spriječiti „zaborav” velikih jezičnih modela

Znanstvenici iz Urbana-Champaigna tvrde da podešavanje samo dijela neuronske mreže sprječava „katastrofalni zaborav” i smanjuje troškove finog treniranja velikih jezičnih modela.

min. čitanja

Istraživači sa Sveučilišta Illinois u Urbana-Champaignu tvrde da su pronašli jednostavniji način finog podešavanja (fine-tuninga) velikih jezičnih modela (LLM) bez takozvanog katastrofalnog zaborava – gubitka već usvojenih sposobnosti nakon dodatnog treniranja.

Glavni naglasci

• Tim je metodu ispitao na dva vizualno-jezična modela, LLaVA i Qwen 2.5-VL. • Umjesto potpunog ponovnog učenja, istraživači su prilagođavali samo usko područje mreže – višeslojni perceptron (MLP) i projiciranja samopažnje. • Takav pristup, kažu, smanjuje računalne troškove, emisije CO₂ i rizik od gubitka znanja.

„Treniranje novog LMM-a može stajati milijune dolara, trajati tjednima i proizvesti stotine tona CO₂, pa je pronalazak učinkovitijih metoda presudno”, navodi se u radu.

Otkriće prave prirode „zaborava”

Autori su prvo željeli potvrditi postojanje i uzrok fenomena. Nakon što su modele izložili nizu specifičnih zadataka, primijetili su očekivani pad performansi na prethodnim testovima – ali i iznenadan oporavak: model je, primjerice, ponovno ostvario dobre rezultate na medicinskom skupu PathVQA.

„Što se činilo kao zaborav zapravo je pristranost u izlaznoj distribuciji uzrokovana pomakom zadatka”, zaključuju. Kada su podešavali samo projiciranja samopažnje, modeli su savladali nove zadatke „bez ikakvog pada u drugim područjima, čak ni nakon pet uzastopnih ciljanih zadataka”.

Tehnički recept

  1. Zamrznuti donju projekciju MLP-a.
  2. Podešavati gornju/gating projekciju MLP-a i/ili projiciranja samopažnje.

Rezultat je, tvrde, usporedivo učenje uz „minimalni drift izlaza” i znatnu uštedu resursa.

Ograničenja i primjena

Studija je zbog ograničenih resursa obuhvatila samo dva modela i multimodalni (slika-tekst) kontekst. Ipak, autori smatraju da se princip može proširiti i na druge LLM-ove te domene, što bi poduzećima omogućilo jeftinije i kontroliranije osvježavanje modela.

#sveuciliste-illinois#urbana-champaign#llava#qwen#pathvqa

Slično

Tehnologija

SpaceX uspješno testirao jedanaesti Starship
Jedanaesti prototip Starshipa poletio je iz Teksasa, približavajući SpaceX cilju ljudskih misija na Mjesec i Mars.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Lažni SMS-ovi opet napadaju: prevaranti se sada predstavljaju kao Netflix
Upozorenje građanima: nove lažne SMS poruke koriste se imenom Netflixa i prijete krađom osobnih podataka.

min čitanja

Više

Tehnologija

MIT predstavio SEAL: sustav koji omogućuje jezičnim modelima da sami sebe usavršavaju
Novo MIT-ovo rješenje SEAL omogućuje velikim jezičnim modelima da samostalno stvaraju podatke i upute za vlastito usavršavanje, a otvoreni kod već izaziva veliku pozornost AI zajednice.

min čitanja

Više

Tehnologija

Australsko istraživanje: covid mijenja spermu i potencijalno oštećuje mozak potomaka
Eksperiment na miševima pokazao je da SARS-CoV-2 kod mužjaka mijenja spermu, a potomci razvijaju promjene u mozgu, osobito u hipokampusu ženki.

min čitanja

Više

Tehnologija

ADAC upozorava: LED svjetla na autima traju kraće od vozila, zamjena stoji i do 3000 eura
Istraživanje ADAC-a pokazuje da LED svjetla prosječno izdrže 15 godina, što je kraće od životnog vijeka automobila, a njihova zamjena može stajati više od vrijednosti vozila.

min čitanja

Više

Tehnologija

Brzi SSD-ovi istiskuju tvrde diskove iz AI podatkovnih centara
Eksplozija AI radnih opterećenja pretvara tvrde diskove u najslabiju kariku podatkovnih centara, dok visokokapacitetni SSD-ovi troše 77 % manje energije i zauzimaju devet puta manje prostora.

min čitanja

Više

Tehnologija

Europska komisija otvara "AI antene" u 13 zemalja, među njima i Ujedinjeno Kraljevstvo i Švicarska
EU uspostavlja mrežu „AI antena” kako bi 13 europskih zemalja, uključujući šest izvan Unije, dobilo izravan pristup superračunalima za razvoj umjetne inteligencije.

min čitanja

Više

Tehnologija

Umijeće asemblija: kako se stara niskorazinska čarolija opet probija na vrh
Od Sawyerova „RollerCoaster Tycoona” do najnovijih AI otkrića, asemblerski kod demonstrira kako ručno ugađanje hardveru i dalje donosi iznenađujuće skokove u brzini i učinkovitosti.

min čitanja

Više

Tehnologija

Otkriveni oralni mikrobi koji utrostručuju rizik od raka gušterače
Opsežna američka studija otkrila je 27 oralnih mikroba koji se povezuju s trostruko većim rizikom od raka gušterače.

min čitanja

Više

Tehnologija

Nobelovac John Martinis ponosno: „Nisam Grk, nego Komižanin”
Fizičar John Martinis, dobitnik Nobela za fiziku 2025., otkrio je da vuče korijene iz Komiže te objasnio zašto vjeruje da je kvantno računalo sve bliže stvarnosti.

min čitanja

Više

Najčitanije

Vijesti

Vukovar svijećama i molitvom odaje počast 97 poginulih policajaca
Komemoracija ispred bivše policijske postaje okupila obitelji, branitelje i državne dužnosnike u sjećanje na heroje iz 1991.

min čitanja

Više

Najnovije

Tehnologija

SpaceX uspješno testirao jedanaesti Starship

Politika

Vučićeva savjetnica priznala da je lažirala vijest o ratu u Crnoj Gori

Vijesti

Četvrta tragedija u Südbadenu: novorođenče pronađeno u vreći za smeće kraj igrališta

Politika

Goldstein i Hasanbegović: Trumpov „holivudski” govor ne nudi rješenje za palestinsku državu

Biznis

Borzan uručila priznanje „Najdonator”: Konzum, Nestlé i Sana predvodnici u darivanju hrane

Lifestyle

Dominik Livaković dobio drugo dijete: vratar Vatrenih ponovno čuva privatnost

Vijesti

Bjelovarčanin diže glas za ravnopravno roditeljstvo: „Nije fer da se sluša samo jedna strana”

Politika

Grčki sindikati stali: štrajk protiv radnog dana od 13 sati paralizira promet

Politika

Trump u Šarm el-Šeiku hvali Meloni: „Ona je nadahnuće svima”

Lifestyle

„The Secret of Me” razotkriva posljedice prisilnih operacija interseks djece

Vijesti

Četvrtina srednjoškolaca eksperimentira s drogom: ljekarne prodaju kućne testove, stručnjaci pozivaju roditelje na rano reagiranje