Razvojni tim Mastra, koji vode inženjeri zaslužni za nekadašnji framework Gatsby, otvorio je izvorni kod nove arhitekture memorije nazvane „observational memory”. Rješenje je odgovor na ograničenja klasičnog RAG-a (retrieval-augmented generation) u složenim agentičkim radnim tokovima gdje modeli moraju dugo raditi, koristiti više alata i ostati u produkciji bez prekida.
Dva agenta, dva bloka konteksta
Sustav dijeli kontekst na dva dijela:
- Blok opažaja – sažeti, datirani zapisi iz prethodnih razgovora.
- Trenutna povijest poruka – sirovi sadržaji tekuće sesije.
Dva pozadinska agenta upravljaju kompresijom:
- Observer nakon otprilike 30 000 neobrađenih tokena pretvara povijest u nove opažaje i briše originalne poruke.
- Reflector kada blok opažaja naraste na oko 40 000 tokena dodatno konsolidira zapise, spaja srodne informacije i uklanja zastarjelo.
Kompresija do 40 puta
Na tekstualnim zadacima arhitektura postiže 3–6× manji kontekst, dok kod agenata koji masovno generiraju izlaze kompresija raste na 5–40×. Time se potpuno uklanja potreba za dinamičkim dohvatom vanjskog korpusa, što pojednostavljuje radni tok i smanjuje latenciju.
Rezultati na testovima
Na mjerilu LongMemEval sustav je s modelom GPT-5-mini ostvario 94,87 %, a s GPT-4o 84,23 %. Za usporedbu, interni RAG isti je zadatak riješio s 80,05 %.
Prednosti i ograničenja
Kompaktni, keširljivi kontekst čini rješenje prikladnim za agente kojima je važnija dosljednost nego široko pretraživanje znanja. Međutim, upravo ta usmjerenost na „ono što je agent već vidio i odlučio” ograničava ga u slučajevima otvorenog otkrivanja novih činjenica ili stroge usklađenosti sa zakonskim zahtjevima za reviziju.
Izjava osnivača
„It has this great characteristic of being both simpler and it is more powerful, like it scores better on the benchmarks”, rekao je Sam Bhagwat, suosnivač i glavni izvršni direktor Mastre.
S obzirom na sve veću potražnju za dugotrajnim, alatima bogatim AI agentima, „observational memory” bi mogla postati ključna komponenta modernih produkcijskih sustava koji zahtijevaju stabilan i jeftin kontekst bez žrtvovanja točnosti.