CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

22. siječnja 2026, 20:08

Kineski MemRL donosi pamćenje LLM agentima bez skupog treniranja

MemRL uvodi epizodno pamćenje i Q-vrijednosti u rad velikih jezičnih modela, omogućujući im da se prilagođavaju novim zadacima bez ponovnog treniranja i pritom nadmaše klasične RAG sustave.

min. čitanja

XFacebookWhatsApp

Istraživači sa Sveučilišta Shanghai Jiao Tong i partnerskih institucija predstavili su MemRL, okvir koji velikim jezičnim modelima (LLM) daje mogućnost da nakon implementacije samostalno uče nove zadatke – bez dodatnog fine-tuninga i rizika od „katastrofičnog zaboravljanja”.

Za razliku od parametarskih metoda, koje zahtijevaju skupo i sporo prilagođavanje težina modela, ili pasivnih sustava pretraživanja znanja (RAG), MemRL odvajа „korteks” (smrznuti LLM) od epizodnog pamćenja smještenog u vanjsku bazu podataka. Svako novo iskustvo pohranjuje se kao trojka „namjera–iskustvo–korisnost”, pri čemu se korisnost mjeri Q-vrijednošću koja se ažurira povratnom informacijom iz okoline.

Taj je „dvofazni” pristup presudan: najprije se pronalaze semantički slična sjećanja, a zatim se ponovno rangiraju prema dosadašnjoj uspješnosti. Time agent uči ignorirati distrakcije i favorizirati rješenja koja su se pokazala djelotvornima, dok sam LLM ostaje netaknut.

MemRL je testiran na četiri različita industrijska mjerila – BigCodeBench (generiranje koda), ALFWorld (navigacija po kućanstvu), Lifelong Agent Bench (rad s operativnim sustavom i bazama) i Humanity’s Last Exam (višedisciplinarno rezoniranje). U svim je kategorijama premašio konkurentske pristupe u učenju u stvarnom vremenu i prenošenju znanja na neviđene zadatke. Posebno se istaknuo u ALFWorldu, gdje je zabilježio približno 56 % bolji rezultat od MemP-a, drugog okvira s memorijom agenta.

Izvedba ne trpi zbog dodatnog koraka potkrepljujućeg učenja: izračun Q-vrijednosti odvija se isključivo na CPU-u, pa kašnjenje ostaje zanemarivo. Ipak, autori upozoravaju na mogućnost „otrovanog pamćenja” – pogrešno ocijenjenih interakcija – no naglašavaju da se problem lako otklanja brisanjem ili resetiranjem spornih zapisa jer je memorija transparentna i revizibilna.

MemRL se uklapa u sve popularniji istraživački smjer nazvan Memory-Based Markov Decision Processes, gdje je dohvat iz memorije definiran kao akcija koju agent optimizira učenjem. Za poslovne korisnike to znači da se opći LLM može pustiti u produkciju, a da potom sam skuplja i vrednuje interne procese, podatke i poslovna pravila – bez stalnog skupog pretreniravanja.

„U svijetu u kojem statični skupovi podataka postaju iscrpljeni, iskustva generirana tijekom života svakog inteligentnog agenta postat će novo gorivo”, poručuju autori. Ako MemRL ispuni obećanja iz laboratorija, sljedeća generacija poslovnih asistenta mogla bi doslovno učiti – dok radi.

#alfworld#memrl#shanghai-jiao-tong#bigcodebench#lifelong-agent-bench

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Fiksne kamere brzinu mjere unutar 100 metara, ne „hvataju” kilometar daleko
Stacionarne kamere GATSO RT4, najčešće postavljene uz hrvatske prometnice, precizno mjere brzinu vozila na udaljenosti do 100 metara, a priče o „hvatanju” s nekoliko stotina metara pokazale su se neutemeljenima.

min čitanja

Više

Tehnologija

Znanstvenici upozoravaju: AI „roj“ lažnih profila prijeti demokraciji
Studija u časopisu Science najavljuje „AI rojeve“ – samostalne mreže lažnih profila sposobne masovno mijenjati javno mnijenje i ugroziti izbore.

min čitanja

Više

Tehnologija

Silicijska dolina bruji o Claude Codeu
Novi alat za pisanje koda Claude Code dobiva pohvale tehničke zajednice i najavljuje zaokret u poslovnom modelu tvrtke Anthropic.

min čitanja

Više

Tehnologija

Salesforce: povjerenje je ključ za skok od 327 % u primjeni AI agenata
Istraživanje Salesforcea otkriva da rukovoditelji planiraju porast od 327 % u korištenju AI agenata, no uspjeh ovisi o povjerenju u podatke i sigurnost.

min čitanja

Više

Tehnologija

Railway prikupio 100 milijuna dolara za ubrzanje oblaka u doba umjetne inteligencije
Sanfranciski startup zatvorio je rundu serije B tešku 100 milijuna dolara kako bi ubrzao isporuku aplikacija i snizio troškove u svijetu koji sve više pokreće umjetna inteligencija.

min čitanja

Više

Tehnologija

Plugin Humanizer okreće Wikipedia-ina pravila protiv otkrivanja AI-teksta
Otvoreni dodatak Humanizer uči Claude kako izbjeći fraze zbog kojih AI tekst lako bude otkriven, koristeći smjernice koje je izradio WikiProject AI Cleanup.

min čitanja

Više

Tehnologija

Ekonomisti: pravedna raspodjela koristi od AI-ja veći je izazov od masovne nezaposlenosti
Nova analiza tvrdi da umjetna inteligencija zasad ne prijeti masovnim otkazima, nego produbljivanju nejednakosti i nepravednoj raspodjeli dobiti.

min čitanja

Više

Tehnologija

Meta interno dovršila nove AI modele, najavila pametne naočale s umjetnom inteligencijom
Meta Superintelligence Labs već isporučuje prve napredne AI modele, dok se Ray-Ban Display naočale s umjetnom inteligencijom spremaju za širu primjenu.

min čitanja

Više

Tehnologija

Volvo predstavio električni EX60 s dosegom većim od 800 km
Električni SUV EX60 donosi doseg od 800 km, punjenje od 10 do 80 % za manje od 20 minuta i prvi prilagodljivi sigurnosni pojas na svijetu.

min čitanja

Više

Tehnologija

Chery najavljuje serijsku proizvodnju električnog Rhino S-a s čvrstom baterijom već iduće godine
Rhino S bi s čvrstom baterijom trebao nuditi 1000 km dosega i stabilne performanse i na −30 °C.

min čitanja

Više

Najčitanije

Politika

HDZ uzvratio Mostu: „Bulj izvlači riječ iz konteksta, Plenković Domovinski rat nikad nije omalovažio”
HDZ-ovi zastupnici optužili su Most za „izvlačenje riječi iz konteksta” nakon što je snimka premijerove izjave iz Davosa izazvala optužbe da omalovažava Domovinski rat.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986PIXSELL, CC BY 3.0 <https://creativecommons.org/licenses/by/3.0>, via Wikimedia Commons

min čitanja

Više

Vijesti

Povučena Nestléjeva hrana za dojenčad zbog opasnog toksina
Državni inspektorat opozvao je seriju "Nestlé NAN COMFORTIS 1" zbog prisutnosti toksina cereulida.

min čitanja

Više

Najnovije

Vijesti

Sudac odbio potvrditi optužnicu protiv Dona Lemona

Biznis

Trump tuži JPMorgan Chase i Jamieja Dimona za najmanje 5 milijardi dolara

Vijesti

Bačvice traže treću obnovu: kupališna zgrada iz 1998. sada treba 12 milijuna eura

Vijesti

Sudara dva automobila zatvorio tunel prema Dugopolju gotovo sat vremena

Vijesti

Britanski iseljenik šokiran prometnom kulturom u Hrvatskoj: „Nije to Balkan, to je patetično”

Sport

Ivan Martinović u utrci za prestižnu nagradu IHF-a

Sport

Nova glavobolja Danske: Magaard poslan kući, Jacobsen ostao bez crtaša

Tehnologija

Fiksne kamere brzinu mjere unutar 100 metara, ne „hvataju” kilometar daleko

Politika

Jack Smith pred Kongresom: „Dokazali smo da je Trump počinio kaznena djela”

Politika

Francuska mornarica presrela ruski tanker u Sredozemlju

Sport

Erlić dvostruki strijelac, Matanović junak Freiburga