CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

22. siječnja 2026, 20:08

Kineski MemRL donosi pamćenje LLM agentima bez skupog treniranja

MemRL uvodi epizodno pamćenje i Q-vrijednosti u rad velikih jezičnih modela, omogućujući im da se prilagođavaju novim zadacima bez ponovnog treniranja i pritom nadmaše klasične RAG sustave.

min. čitanja

XFacebookWhatsApp

Istraživači sa Sveučilišta Shanghai Jiao Tong i partnerskih institucija predstavili su MemRL, okvir koji velikim jezičnim modelima (LLM) daje mogućnost da nakon implementacije samostalno uče nove zadatke – bez dodatnog fine-tuninga i rizika od „katastrofičnog zaboravljanja”.

Za razliku od parametarskih metoda, koje zahtijevaju skupo i sporo prilagođavanje težina modela, ili pasivnih sustava pretraživanja znanja (RAG), MemRL odvajа „korteks” (smrznuti LLM) od epizodnog pamćenja smještenog u vanjsku bazu podataka. Svako novo iskustvo pohranjuje se kao trojka „namjera–iskustvo–korisnost”, pri čemu se korisnost mjeri Q-vrijednošću koja se ažurira povratnom informacijom iz okoline.

Taj je „dvofazni” pristup presudan: najprije se pronalaze semantički slična sjećanja, a zatim se ponovno rangiraju prema dosadašnjoj uspješnosti. Time agent uči ignorirati distrakcije i favorizirati rješenja koja su se pokazala djelotvornima, dok sam LLM ostaje netaknut.

MemRL je testiran na četiri različita industrijska mjerila – BigCodeBench (generiranje koda), ALFWorld (navigacija po kućanstvu), Lifelong Agent Bench (rad s operativnim sustavom i bazama) i Humanity’s Last Exam (višedisciplinarno rezoniranje). U svim je kategorijama premašio konkurentske pristupe u učenju u stvarnom vremenu i prenošenju znanja na neviđene zadatke. Posebno se istaknuo u ALFWorldu, gdje je zabilježio približno 56 % bolji rezultat od MemP-a, drugog okvira s memorijom agenta.

Izvedba ne trpi zbog dodatnog koraka potkrepljujućeg učenja: izračun Q-vrijednosti odvija se isključivo na CPU-u, pa kašnjenje ostaje zanemarivo. Ipak, autori upozoravaju na mogućnost „otrovanog pamćenja” – pogrešno ocijenjenih interakcija – no naglašavaju da se problem lako otklanja brisanjem ili resetiranjem spornih zapisa jer je memorija transparentna i revizibilna.

MemRL se uklapa u sve popularniji istraživački smjer nazvan Memory-Based Markov Decision Processes, gdje je dohvat iz memorije definiran kao akcija koju agent optimizira učenjem. Za poslovne korisnike to znači da se opći LLM može pustiti u produkciju, a da potom sam skuplja i vrednuje interne procese, podatke i poslovna pravila – bez stalnog skupog pretreniravanja.

„U svijetu u kojem statični skupovi podataka postaju iscrpljeni, iskustva generirana tijekom života svakog inteligentnog agenta postat će novo gorivo”, poručuju autori. Ako MemRL ispuni obećanja iz laboratorija, sljedeća generacija poslovnih asistenta mogla bi doslovno učiti – dok radi.

#alfworld#memrl#shanghai-jiao-tong#bigcodebench#lifelong-agent-bench
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Novi opoziv Cybertrucka: Teslinu „neuništivom” pick-upu prijeti ispadanje kotača
Tesla opoziva još 173 Cybertrucka jer pogrešna mast može uzrokovati pucanje kočionih diskova i otpadanje kotača, što je već jedanaesta greška na kontroverznom električnom pick-upu.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja
Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”
Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej
Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku
Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi
Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete
Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja
Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Supetarska gradonačelnica o napadu na Vukovića: prijetnje ne smiju postati normalne
Gradonačelnica Supetra osudila je fizički napad na novinara Sinišu Vukovića na splitskoj Rivi i pozvala građane da prijavljuju sve prijetnje.

min čitanja

Više

Politika

Plenković u Novoj Gradiški: HDZ-ovi kandidati nude stabilnost i razvoj
Premijer Andrej Plenković u Novoj Gradiški podržao HDZ-ove kandidate Bernardina Trnku i Brunu Bušića, naglasivši nužnost stabilnog vodstva i nastavka razvojnih projekata.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana
KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Kvarner u Zagrebu protiv Cibone lovi posljednji vlak za doigravanje

Sport

Vrhunac drame u Trećoj NL Istok: Marsonia vreba povratak na vrh

Sport

Klapa HRM-a „Sveti Juraj” pjesmom podiže moral Vatrenima

Vijesti

Dvostruka akcija HGSS-a Split: isti dan spašene dvije ozlijeđene turistkinje

Sport

Riječki boksač Ramljak u polufinalu državnog prvenstva

Politika

Ivošević optužio Šutu: grad ignorira napade na novinare

Vijesti

Skele oko Tuđmanova spomenika: redovito održavanje traje do 15. svibnja

Vijesti

Ronioci najavili čišćenje podmorja uz Sustipan povodom blagdana sv. Duje

Sport

Đakovo Croatia pod pritiskom: derbi začelja protiv Hrvatskog dragovoljca odlučuje sezonu

Sport

Rijeka glatko slavila u Vukovaru i vratila treće mjesto pred finale Kupa

Lifestyle

Renata Lovrinčević Buljan usred Sudamje demonstrirala hitnu „rehabilitaciju”