CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

22. siječnja 2026, 20:08

Kineski MemRL donosi pamćenje LLM agentima bez skupog treniranja

MemRL uvodi epizodno pamćenje i Q-vrijednosti u rad velikih jezičnih modela, omogućujući im da se prilagođavaju novim zadacima bez ponovnog treniranja i pritom nadmaše klasične RAG sustave.

min. čitanja

XFacebookWhatsApp

Istraživači sa Sveučilišta Shanghai Jiao Tong i partnerskih institucija predstavili su MemRL, okvir koji velikim jezičnim modelima (LLM) daje mogućnost da nakon implementacije samostalno uče nove zadatke – bez dodatnog fine-tuninga i rizika od „katastrofičnog zaboravljanja”.

Za razliku od parametarskih metoda, koje zahtijevaju skupo i sporo prilagođavanje težina modela, ili pasivnih sustava pretraživanja znanja (RAG), MemRL odvajа „korteks” (smrznuti LLM) od epizodnog pamćenja smještenog u vanjsku bazu podataka. Svako novo iskustvo pohranjuje se kao trojka „namjera–iskustvo–korisnost”, pri čemu se korisnost mjeri Q-vrijednošću koja se ažurira povratnom informacijom iz okoline.

Taj je „dvofazni” pristup presudan: najprije se pronalaze semantički slična sjećanja, a zatim se ponovno rangiraju prema dosadašnjoj uspješnosti. Time agent uči ignorirati distrakcije i favorizirati rješenja koja su se pokazala djelotvornima, dok sam LLM ostaje netaknut.

MemRL je testiran na četiri različita industrijska mjerila – BigCodeBench (generiranje koda), ALFWorld (navigacija po kućanstvu), Lifelong Agent Bench (rad s operativnim sustavom i bazama) i Humanity’s Last Exam (višedisciplinarno rezoniranje). U svim je kategorijama premašio konkurentske pristupe u učenju u stvarnom vremenu i prenošenju znanja na neviđene zadatke. Posebno se istaknuo u ALFWorldu, gdje je zabilježio približno 56 % bolji rezultat od MemP-a, drugog okvira s memorijom agenta.

Izvedba ne trpi zbog dodatnog koraka potkrepljujućeg učenja: izračun Q-vrijednosti odvija se isključivo na CPU-u, pa kašnjenje ostaje zanemarivo. Ipak, autori upozoravaju na mogućnost „otrovanog pamćenja” – pogrešno ocijenjenih interakcija – no naglašavaju da se problem lako otklanja brisanjem ili resetiranjem spornih zapisa jer je memorija transparentna i revizibilna.

MemRL se uklapa u sve popularniji istraživački smjer nazvan Memory-Based Markov Decision Processes, gdje je dohvat iz memorije definiran kao akcija koju agent optimizira učenjem. Za poslovne korisnike to znači da se opći LLM može pustiti u produkciju, a da potom sam skuplja i vrednuje interne procese, podatke i poslovna pravila – bez stalnog skupog pretreniravanja.

„U svijetu u kojem statični skupovi podataka postaju iscrpljeni, iskustva generirana tijekom života svakog inteligentnog agenta postat će novo gorivo”, poručuju autori. Ako MemRL ispuni obećanja iz laboratorija, sljedeća generacija poslovnih asistenta mogla bi doslovno učiti – dok radi.

#alfworld#memrl#shanghai-jiao-tong#bigcodebench#lifelong-agent-bench

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Ukrajina otvara bojišne podatke za treniranje savezničkih AI sustava
Ministar obrane Mihajlo Fedorov kaže da Kijev partnerima stavlja na raspolaganje milijune bojišnih snimki kako bi ubrzali razvoj autonomnih sustava protiv Rusije.
President Of Ukraine from Україна, CC0, via Wikimedia Commons

min čitanja

Više

Tehnologija

Brzi rast podatkovnih centara prijeti europskoj energetskoj mreži
Europski skok u umjetnoj inteligenciji otvara novu energetsku bitku: mogu li podatkovni centri rasti, a mreža ostati zelena?

min čitanja

Više

Tehnologija

Google Mapama stiže „Ask Maps”: razgovorni AI planira rute i vodi kroz 3D navigaciju
Razgovorni alat „Ask Maps” od danas korisnicima u SAD-u i Indiji nudi personalizirano planiranje ruta, dok Immersive Navigation donosi 3D prikaz kretanja u Google Kartama.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Moskovljani se vraćaju voki-tokijima dok vlasti guše mobilni internet
Nepojasnjeni prekidi mobilnog interneta u Moskvi i St. Petersburgu prisilili su građane da komuniciraju voki-tokijima, dok vlasti guraju državnu „super-aplikaciju” Max.

min čitanja

Više

Tehnologija

Riječki umjetnik Andrej Zbašnik predstavio dijaloški eksperiment s umjetnom inteligencijom
U Galeriji OK predstavljena je knjiga „Dijalozi o životu i umjetnosti“, nastala u dijalogu riječkog umjetnika Andreja Zbašnika i umjetne inteligencije ChatGPT.

min čitanja

Više

Tehnologija

Platforma InferenceSense pretvara mrtvo vrijeme GPU-ova u prihod
Startup FriendliAI lansirao je InferenceSense, sustav koji automatski preusmjerava neiskorištene GPU-ove na plaćene AI inferencije i prihod dijeli s operaterom.

min čitanja

Više

Tehnologija

Opatijska TZ nudi iznajmljivačima bržu prijavu gostiju kroz aplikaciju mVisitor
TZ Opatije predstavila aplikaciju mVisitor koja vlasnicima apartmana omogućuje brzu i besplatnu prijavu gostiju u sustav eVisitor.

min čitanja

Više

Tehnologija

Zagreb razvija prometni portal vrijedan tri milijuna eura
Digitalna platforma omogućit će Zagrepčanima praćenje prometa uživo, prijavu problema i pristup e-uslugama, dok će gradskim službama donijeti preciznije analize i planiranje.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Nvidia lansirala Nemotron 3 Super, hibridni AI od 120 milijardi parametara
Nvidia je predstavila Nemotron 3 Super, hibridni model od 120 milijardi parametara namijenjen jeftinijem pogonu višestrukih AI-agenata u poslovnim okruženjima.

min čitanja

Više

Tehnologija

Googleov tim razvija AI agente koji spontano surađuju bez tvrdokodiranih pravila
Paradigms of Intelligence pokazuje da treniranje AI agenata protiv raznovrsnih protivnika stvara fleksibilne, suradljive sustave prikladne za složene poslovne primjene.

min čitanja

Više

Najčitanije

Biznis

Iva Radić odstupila s čela Journal Media: prijavila sumnje u izvlačenje novca
Osnivačica portala Journal.hr podnijela je ostavku na mjesto direktorice zbog sumnji u višegodišnje nezakonite radnje nad financijama tvrtke, dok je poslovanje portala privremeno zaustavljeno.

min čitanja

Više

Najnovije

Vijesti

Slavonsko selo i senzorno igralište obogatili osječki Zoološki vrt

Vijesti

Splitski taksisti tuže grad: brzopotezna podjela 60 koncesija izazvala pobunu

Lifestyle

Reper Nered nakon 800 kilometara Caminom planira novo hodočašće

Lifestyle

Blues diva Kyla Brox večeras u Puli, dio prihoda za djecu

Vijesti

Vinkovci ugostili fra Ivicu Perića: „Hrvatsko srce školuje tisuće djece u Africi”

Sport

Halilhodžić preuzeo Nantes: „Dugujem mu, ovo mi je posljednji posao”

Politika

Varšava uvodi zabranu noćne prodaje alkohola

Sport

Strukan sudi Dinamu, Pavlešić derbi na Poljudu

Biznis

Churchilla i Austena mijenjaju vidre i ježevi na novim britanskim novčanicama

Lifestyle

Plavi ožujak poziva na pregled: akcija protiv raka debelog crijeva u 13 gradova

Vijesti

Kutleša o naslijeđu kardinala Kuharića: „Ako budemo narod savjesti, bit ćemo narod nade”