Retrieval augmented generation (RAG) posljednjih je godina bio standardni način na koji se veliki jezični modeli povezuju s vanjskim znanjem. No dok se količina podataka i složenost zadataka povećavaju, taj se pristup pokazuje nedovoljnim za agente koji moraju pamtiti kroz više sesija, razlikovati činjenice od zaključaka i dinamički prilagođavati svoja uvjerenja.
Na scenu stupa otvorenokodni sustav memorije Hindsight, rezultat suradnje tvrtke Vectorize.io s istraživačima sa Sveučilišta Virginia Tech i redakcijom The Washington Posta. Sustav pamćenje organizira u četiri odvojene mreže:
- world – objektivne činjenice o vanjskom svijetu;
- bank – agentova vlastita iskustva, bilježena u prvom licu;
- opinion – subjektivni sudovi s pridruženim stupnjem pouzdanja koji se mijenja kako pristižu novi dokazi;
- observation – sažeci entiteta neutralni prema preferencijama, izvedeni iz prikupljenih podataka.
Takva raspodjela, ističu autori, donosi „epistemološku jasnoću” jer fizički odvaja dokazni materijal od zaključaka. Kada agent formira mišljenje, to uvjerenje pohranjuje zasebno od potpornih činjenica, zajedno s ocjenom sigurnosti koja se naknadno može povećati ili smanjiti.
Usporedba na benchmarku LongMemEval pokazala je koliko struktura znači: Hindsight je postigao 91,4 % točnosti, najvišu zabilježenu na tom testu. Posebno dramatična poboljšanja viđena su u zadacima višesesijskog odgovaranja (s 21,1 % na 79,7 %), vremenskog zaključivanja (s 31,6 % na 79,7 %) te ažuriranja znanja (s 60,3 % na 84,6 %).
„RAG je na aparatima za održavanje života, a memorija agenata sprema se potpuno ga zamijeniti”, poručio je suosnivač i direktor Vectorize.io-a Chris Latimer, najavivši val nove infrastrukture koja bi tradicionalne vektorske baze mogla poslati u mirovinu.
Za razliku od uobičajenog „izvuci-i-ubaci” modela, gdje se relevantni tekstualni isječci jednostavno dodaju promptu, Hindsight tretira memoriju kao logički strukturiranu podlogu za zaključivanje. Time AI agent dobiva sličniji način rada ljudskome umu: svjesno razlikuje što je vidio, što je naučio i koliko čvrsto u to vjeruje.
Ako se rezultati potvrde u širem spektru primjena, 2025. bi mogla označiti prekretnicu – od ere RAG-a k arhitekturama koje memoriju stavljaju u samo središte razmišljanja umjetne inteligencije.