CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

14. listopada 2025, 06:15

Novo američko istraživanje pokazalo kako spriječiti „zaborav” velikih jezičnih modela

Znanstvenici iz Urbana-Champaigna tvrde da podešavanje samo dijela neuronske mreže sprječava „katastrofalni zaborav” i smanjuje troškove finog treniranja velikih jezičnih modela.

min. čitanja

XFacebookWhatsApp

Istraživači sa Sveučilišta Illinois u Urbana-Champaignu tvrde da su pronašli jednostavniji način finog podešavanja (fine-tuninga) velikih jezičnih modela (LLM) bez takozvanog katastrofalnog zaborava – gubitka već usvojenih sposobnosti nakon dodatnog treniranja.

Glavni naglasci

• Tim je metodu ispitao na dva vizualno-jezična modela, LLaVA i Qwen 2.5-VL. • Umjesto potpunog ponovnog učenja, istraživači su prilagođavali samo usko područje mreže – višeslojni perceptron (MLP) i projiciranja samopažnje. • Takav pristup, kažu, smanjuje računalne troškove, emisije CO₂ i rizik od gubitka znanja.

„Treniranje novog LMM-a može stajati milijune dolara, trajati tjednima i proizvesti stotine tona CO₂, pa je pronalazak učinkovitijih metoda presudno”, navodi se u radu.

Otkriće prave prirode „zaborava”

Autori su prvo željeli potvrditi postojanje i uzrok fenomena. Nakon što su modele izložili nizu specifičnih zadataka, primijetili su očekivani pad performansi na prethodnim testovima – ali i iznenadan oporavak: model je, primjerice, ponovno ostvario dobre rezultate na medicinskom skupu PathVQA.

„Što se činilo kao zaborav zapravo je pristranost u izlaznoj distribuciji uzrokovana pomakom zadatka”, zaključuju. Kada su podešavali samo projiciranja samopažnje, modeli su savladali nove zadatke „bez ikakvog pada u drugim područjima, čak ni nakon pet uzastopnih ciljanih zadataka”.

Tehnički recept

  1. Zamrznuti donju projekciju MLP-a.
  2. Podešavati gornju/gating projekciju MLP-a i/ili projiciranja samopažnje.

Rezultat je, tvrde, usporedivo učenje uz „minimalni drift izlaza” i znatnu uštedu resursa.

Ograničenja i primjena

Studija je zbog ograničenih resursa obuhvatila samo dva modela i multimodalni (slika-tekst) kontekst. Ipak, autori smatraju da se princip može proširiti i na druge LLM-ove te domene, što bi poduzećima omogućilo jeftinije i kontroliranije osvježavanje modela.

#sveuciliste-illinois#urbana-champaign#llava#qwen#pathvqa

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

CroPC.net slavi 20 godina: entuzijazam i upornost pretvorili hobi u cijenjeni tech portal
Hrvatski tehnološki portal CroPC.net obilježava dva desetljeća rada, potvrđujući da se dugoročan uspjeh gradi entuzijazmom i upornošću.

min čitanja

Više

Tehnologija

Massachusetts najavljuje zakon koji bi proizvođače prisilio da otkriju datum „smrti” pametnih uređaja
Prijedlog zakona u Massachusettsu zahtijevao bi da proizvođači pametnih uređaja unaprijed otkriju do kad će trajati softverska podrška, čime se potrošače želi zaštititi od iznenadne neupotrebljivosti i kibernetičkih prijetnji.

min čitanja

Više

Tehnologija

Nova era glasovnih sučelja: brži od ljudske percepcije i sposobni za emocije
Inworld, Nvidia, Qwen i Google DeepMind u tjedan dana uklonili su kašnjenje, riješili prekidanje, smanjili potrošnju podataka i dodali emocionalnu inteligenciju glasovnim asistentima.

min čitanja

Više

Tehnologija

Švedska briše AI hit s ljestvica: „Jacub” s 6 milijuna streamova ostaje bez službenog plasmana
IFPI Sweden izbacio je viralni singl virtualnog izvođača Jacuba sa službene ljestvice, tvrdeći da je previše generiran umjetnom inteligencijom.

min čitanja

Više

Tehnologija

Fiksne kamere brzinu mjere unutar 100 metara, ne „hvataju” kilometar daleko
Stacionarne kamere GATSO RT4, najčešće postavljene uz hrvatske prometnice, precizno mjere brzinu vozila na udaljenosti do 100 metara, a priče o „hvatanju” s nekoliko stotina metara pokazale su se neutemeljenima.

min čitanja

Više

Tehnologija

Znanstvenici upozoravaju: AI „roj“ lažnih profila prijeti demokraciji
Studija u časopisu Science najavljuje „AI rojeve“ – samostalne mreže lažnih profila sposobne masovno mijenjati javno mnijenje i ugroziti izbore.

min čitanja

Više

Tehnologija

Kineski MemRL donosi pamćenje LLM agentima bez skupog treniranja
MemRL uvodi epizodno pamćenje i Q-vrijednosti u rad velikih jezičnih modela, omogućujući im da se prilagođavaju novim zadacima bez ponovnog treniranja i pritom nadmaše klasične RAG sustave.

min čitanja

Više

Tehnologija

Silicijska dolina bruji o Claude Codeu
Novi alat za pisanje koda Claude Code dobiva pohvale tehničke zajednice i najavljuje zaokret u poslovnom modelu tvrtke Anthropic.

min čitanja

Više

Tehnologija

Salesforce: povjerenje je ključ za skok od 327 % u primjeni AI agenata
Istraživanje Salesforcea otkriva da rukovoditelji planiraju porast od 327 % u korištenju AI agenata, no uspjeh ovisi o povjerenju u podatke i sigurnost.

min čitanja

Više

Tehnologija

Railway prikupio 100 milijuna dolara za ubrzanje oblaka u doba umjetne inteligencije
Sanfranciski startup zatvorio je rundu serije B tešku 100 milijuna dolara kako bi ubrzao isporuku aplikacija i snizio troškove u svijetu koji sve više pokreće umjetna inteligencija.

min čitanja

Više

Najčitanije

Biznis

Alarm na tržištu peleta: cijena vreće skočila 65 % u samo mjesec dana
Potrošačka platforma „Halo, inspektore” traži hitnu intervenciju zbog skoka cijena peleta, ističući da Hrvatska izvozi 80 % proizvodnje dok domaća kućanstva plaćaju rekordne iznose.

min čitanja

Više

Politika

SDP traži Plenkovićevo objašnjenje o sudjelovanju Hrvatske u „Odboru za mir” Donalda Trumpa
Hajdaš Dončić traži da Vlada objasni planira li Hrvatska pristupiti novom „Odboru za mir”, projektu koji Europska unija zasad zaobilazi.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986Autor Social Democratic Party of Croatia - https://flickr.com/photos/59485410@N07/29007717956, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=153450927

min čitanja

Više

Najnovije

Vijesti

Građevinski šut zatrpao šumu kod Rovinja: Ljuti komentari građana

Lifestyle

Stanković u nedjelju otvara raspravu o trendu estetskih zahvata

Sport

Alcaraz stiže Borgu, Medvedev preokretom spasio nadu na Australian Openu

Biznis

Slovenska vlada ulazi u utrku za Ljubljansku burzu

Politika

Šibenik se prisjeća tajne mobilizacije 550 dragovoljaca: 35 godina od prve crte obrane protiv JNA

Politika

Trump razbjesnio britanske zastupnike omalovažavanjem žrtava u Afganistanu

Biznis

Alarm na tržištu peleta: cijena vreće skočila 65 % u samo mjesec dana

Sport

Gvardiol proslavio 24. rođendan, a pozornost krade njegova nova ljubav

Vijesti

Sarajevo opet prednjači u svjetskom zagađenju zraka

Sport

Hajduk kreće u lov na naslov: povratak Livaje, sjaj Šege i neizvjesna borba s Dinamom

Lifestyle

Studenti pulske Muzičke akademije pokazali raskoš talenta na prvom zimskom koncertu