Tehnologija

14. listopada 2025, 06:15

Novo američko istraživanje pokazalo kako spriječiti „zaborav” velikih jezičnih modela

Znanstvenici iz Urbana-Champaigna tvrde da podešavanje samo dijela neuronske mreže sprječava „katastrofalni zaborav” i smanjuje troškove finog treniranja velikih jezičnih modela.

min. čitanja

Istraživači sa Sveučilišta Illinois u Urbana-Champaignu tvrde da su pronašli jednostavniji način finog podešavanja (fine-tuninga) velikih jezičnih modela (LLM) bez takozvanog katastrofalnog zaborava – gubitka već usvojenih sposobnosti nakon dodatnog treniranja.

Glavni naglasci

• Tim je metodu ispitao na dva vizualno-jezična modela, LLaVA i Qwen 2.5-VL. • Umjesto potpunog ponovnog učenja, istraživači su prilagođavali samo usko područje mreže – višeslojni perceptron (MLP) i projiciranja samopažnje. • Takav pristup, kažu, smanjuje računalne troškove, emisije CO₂ i rizik od gubitka znanja.

„Treniranje novog LMM-a može stajati milijune dolara, trajati tjednima i proizvesti stotine tona CO₂, pa je pronalazak učinkovitijih metoda presudno”, navodi se u radu.

Otkriće prave prirode „zaborava”

Autori su prvo željeli potvrditi postojanje i uzrok fenomena. Nakon što su modele izložili nizu specifičnih zadataka, primijetili su očekivani pad performansi na prethodnim testovima – ali i iznenadan oporavak: model je, primjerice, ponovno ostvario dobre rezultate na medicinskom skupu PathVQA.

„Što se činilo kao zaborav zapravo je pristranost u izlaznoj distribuciji uzrokovana pomakom zadatka”, zaključuju. Kada su podešavali samo projiciranja samopažnje, modeli su savladali nove zadatke „bez ikakvog pada u drugim područjima, čak ni nakon pet uzastopnih ciljanih zadataka”.

Tehnički recept

Zamrznuti donju projekciju MLP-a.
Podešavati gornju/gating projekciju MLP-a i/ili projiciranja samopažnje.

Rezultat je, tvrde, usporedivo učenje uz „minimalni drift izlaza” i znatnu uštedu resursa.

Ograničenja i primjena

Studija je zbog ograničenih resursa obuhvatila samo dva modela i multimodalni (slika-tekst) kontekst. Ipak, autori smatraju da se princip može proširiti i na druge LLM-ove te domene, što bi poduzećima omogućilo jeftinije i kontroliranije osvježavanje modela.

#sveuciliste-illinois #urbana-champaign #llava #qwen #pathvqa

Slično

Tehnologija

SpaceX uspješno testirao jedanaesti Starship

Jedanaesti prototip Starshipa poletio je iz Teksasa, približavajući SpaceX cilju ljudskih misija na Mjesec i Mars.

min čitanja

Više

Tehnologija

Lažni SMS-ovi opet napadaju: prevaranti se sada predstavljaju kao Netflix

Upozorenje građanima: nove lažne SMS poruke koriste se imenom Netflixa i prijete krađom osobnih podataka.

min čitanja

Više

Tehnologija

MIT predstavio SEAL: sustav koji omogućuje jezičnim modelima da sami sebe usavršavaju

Novo MIT-ovo rješenje SEAL omogućuje velikim jezičnim modelima da samostalno stvaraju podatke i upute za vlastito usavršavanje, a otvoreni kod već izaziva veliku pozornost AI zajednice.

min čitanja

Više

Tehnologija

Australsko istraživanje: covid mijenja spermu i potencijalno oštećuje mozak potomaka

Eksperiment na miševima pokazao je da SARS-CoV-2 kod mužjaka mijenja spermu, a potomci razvijaju promjene u mozgu, osobito u hipokampusu ženki.

min čitanja

Više

Tehnologija

ADAC upozorava: LED svjetla na autima traju kraće od vozila, zamjena stoji i do 3000 eura

Istraživanje ADAC-a pokazuje da LED svjetla prosječno izdrže 15 godina, što je kraće od životnog vijeka automobila, a njihova zamjena može stajati više od vrijednosti vozila.

min čitanja

Više

Tehnologija

Brzi SSD-ovi istiskuju tvrde diskove iz AI podatkovnih centara

Eksplozija AI radnih opterećenja pretvara tvrde diskove u najslabiju kariku podatkovnih centara, dok visokokapacitetni SSD-ovi troše 77 % manje energije i zauzimaju devet puta manje prostora.

min čitanja

Više

Tehnologija

Europska komisija otvara "AI antene" u 13 zemalja, među njima i Ujedinjeno Kraljevstvo i Švicarska

EU uspostavlja mrežu „AI antena” kako bi 13 europskih zemalja, uključujući šest izvan Unije, dobilo izravan pristup superračunalima za razvoj umjetne inteligencije.

min čitanja

Više

Tehnologija

Umijeće asemblija: kako se stara niskorazinska čarolija opet probija na vrh

Od Sawyerova „RollerCoaster Tycoona” do najnovijih AI otkrića, asemblerski kod demonstrira kako ručno ugađanje hardveru i dalje donosi iznenađujuće skokove u brzini i učinkovitosti.

min čitanja

Više

Tehnologija

Otkriveni oralni mikrobi koji utrostručuju rizik od raka gušterače

Opsežna američka studija otkrila je 27 oralnih mikroba koji se povezuju s trostruko većim rizikom od raka gušterače.

min čitanja

Više

Tehnologija

Nobelovac John Martinis ponosno: „Nisam Grk, nego Komižanin”

Fizičar John Martinis, dobitnik Nobela za fiziku 2025., otkrio je da vuče korijene iz Komiže te objasnio zašto vjeruje da je kvantno računalo sve bliže stvarnosti.

min čitanja

Više

Tehnologija

14. listopada 2025, 06:15

Novo američko istraživanje pokazalo kako spriječiti „zaborav” velikih jezičnih modela

Znanstvenici iz Urbana-Champaigna tvrde da podešavanje samo dijela neuronske mreže sprječava „katastrofalni zaborav” i smanjuje troškove finog treniranja velikih jezičnih modela.

min. čitanja

Glavni naglasci

„Treniranje novog LMM-a može stajati milijune dolara, trajati tjednima i proizvesti stotine tona CO₂, pa je pronalazak učinkovitijih metoda presudno”, navodi se u radu.

Otkriće prave prirode „zaborava”

Tehnički recept

Zamrznuti donju projekciju MLP-a.
Podešavati gornju/gating projekciju MLP-a i/ili projiciranja samopažnje.

Rezultat je, tvrde, usporedivo učenje uz „minimalni drift izlaza” i znatnu uštedu resursa.

Ograničenja i primjena

#sveuciliste-illinois #urbana-champaign #llava #qwen #pathvqa

Slično

Tehnologija

SpaceX uspješno testirao jedanaesti Starship

Jedanaesti prototip Starshipa poletio je iz Teksasa, približavajući SpaceX cilju ljudskih misija na Mjesec i Mars.

min čitanja

Više

Tehnologija

Lažni SMS-ovi opet napadaju: prevaranti se sada predstavljaju kao Netflix

Upozorenje građanima: nove lažne SMS poruke koriste se imenom Netflixa i prijete krađom osobnih podataka.

min čitanja

Više

Tehnologija

MIT predstavio SEAL: sustav koji omogućuje jezičnim modelima da sami sebe usavršavaju

Novo MIT-ovo rješenje SEAL omogućuje velikim jezičnim modelima da samostalno stvaraju podatke i upute za vlastito usavršavanje, a otvoreni kod već izaziva veliku pozornost AI zajednice.

min čitanja

Više

Tehnologija

Australsko istraživanje: covid mijenja spermu i potencijalno oštećuje mozak potomaka

Eksperiment na miševima pokazao je da SARS-CoV-2 kod mužjaka mijenja spermu, a potomci razvijaju promjene u mozgu, osobito u hipokampusu ženki.

min čitanja

Više

Tehnologija

ADAC upozorava: LED svjetla na autima traju kraće od vozila, zamjena stoji i do 3000 eura

Istraživanje ADAC-a pokazuje da LED svjetla prosječno izdrže 15 godina, što je kraće od životnog vijeka automobila, a njihova zamjena može stajati više od vrijednosti vozila.

min čitanja

Više

Tehnologija

Brzi SSD-ovi istiskuju tvrde diskove iz AI podatkovnih centara

Eksplozija AI radnih opterećenja pretvara tvrde diskove u najslabiju kariku podatkovnih centara, dok visokokapacitetni SSD-ovi troše 77 % manje energije i zauzimaju devet puta manje prostora.

min čitanja

Više

Tehnologija

Europska komisija otvara "AI antene" u 13 zemalja, među njima i Ujedinjeno Kraljevstvo i Švicarska

EU uspostavlja mrežu „AI antena” kako bi 13 europskih zemalja, uključujući šest izvan Unije, dobilo izravan pristup superračunalima za razvoj umjetne inteligencije.

min čitanja

Više

Tehnologija

Umijeće asemblija: kako se stara niskorazinska čarolija opet probija na vrh

Od Sawyerova „RollerCoaster Tycoona” do najnovijih AI otkrića, asemblerski kod demonstrira kako ručno ugađanje hardveru i dalje donosi iznenađujuće skokove u brzini i učinkovitosti.

min čitanja

Više

Tehnologija

Otkriveni oralni mikrobi koji utrostručuju rizik od raka gušterače

Opsežna američka studija otkrila je 27 oralnih mikroba koji se povezuju s trostruko većim rizikom od raka gušterače.

min čitanja

Više

Tehnologija

Nobelovac John Martinis ponosno: „Nisam Grk, nego Komižanin”

Fizičar John Martinis, dobitnik Nobela za fiziku 2025., otkrio je da vuče korijene iz Komiže te objasnio zašto vjeruje da je kvantno računalo sve bliže stvarnosti.

min čitanja

Više