Istraživači sa Sveučilišta Zhejiang i Alibaba Groupa predstavili su Memp – okvir koji velikim jezičnim modelima (LLM) ugrađuje „proceduralno pamćenje”, omogućujući im da uče iz vlastitog iskustva i postaju učinkovitiji pri dugotrajnim, složenim zadacima.
Memp tretira pamćenje kao jezgrenu komponentu koju sustav stalno gradi, pretražuje i ažurira. Umjesto da agent svaki put kreće od nule, prethodne uspješne (ali i neuspjele) „trajektorije” pretvara u:
• doslovne zapise korak-po-korak ili
• sažete, skriptne apstrakcije koje je lakše primijeniti na nove situacije.
Najvažniji je mehanizam ažuriranja: nakon svake nove zadaće agent može jednostavno dodati iskustvo, filtrirati samo uspješne ishode ili refleksijom ispraviti prijašnje pogreške. Time se, ističu autori, „praksa pretvara u perfekciju” – agent postupno proširuje repertoar vještina bez gubitka već stečenog znanja.
Smanjenje troškova i koraka U testovima na zadacima kućanskih poslova (ALFWorld) i planiranja putovanja (TravelPlanner) agenti opremljeni Memptom ostvarili su:
• višu stopu uspjeha, • znatno manje koraka potrebnih za dovršetak zadatka i • manju potrošnju tokena.
Proceduralno pamćenje pokazalo se i prijenosnim: memorija nastala radom moćnog GPT-4o prebačena je na znatno manji model Qwen2.5-14B, koji je potom osjetno poboljšao rezultate. Manji modeli već dobro rješavaju jednostavne radnje, ali se muče s dugoročnim planiranjem; Memp popunjava upravo tu prazninu.
Raspoznati „kako” umjesto samo „što” Autori razlikuju svoj pristup od prijašnjih sustava poput Mem0 ili A-MEM koji uglavnom pamte bitne informacije unutar jedne interakcije. „Memp cilja na proceduralno ‘kako-to’ znanje koje se može generalizirati preko sličnih zadataka”, objašnjava koautor Runnan Fang. Time se izbjegava potreba za ponovnim istraživanjem svaki put kada dođe do promjene sučelja, sheme podataka ili mrežnog prekida.
Hladni start bez „zlatnih” primjera Problem početka bez ikakve memorije rješava se definiranjem metrike uspješnosti. Nakon što pravila ocjenjivanja – ručna ili uz pomoć drugog LLM-a – budu postavljena, najnapredniji modeli istražuju prostor zadatka i pohranjuju tragove s najvišim ocjenama. Tako se brzo gradi inicijalna baza korisnih procedura bez opsežnog ručnog programiranja.
Korak prema potpunoj autonomiji Za mnoge stvarne poslove, poput izrade istraživačkog izvještaja, ne postoji jednostavan signal uspjeha. Fang stoga vidi sljedeći iskorak u „LLM-u kao sucu” koji bi davao nijansirane povratne informacije i omogućio daljnje samousavršavanje agenata. Uz takvu povratnu spregu Memp bi mogao postati ključna karika u razvoju pouzdanih, prilagodljivih i zaista autonomnih digitalnih radnika.