Uzlet velikih jezičnih modela s kontekstom od milijun tokena potaknuo je tezu da će agentne memorije uskoro izgurati vektorske baze podataka. Najnoviji potezi berlinskog Qdranta govore suprotno.
Tvrtka je najavila investiciju od 50 milijuna dolara (Series B) i objavila verziju 1.17 svoje otvorenokodne platforme. Poruka je jasna: dolaskom autonomnih agenata problem pronalaženja podataka nije nestao, već se eksponencijalno povećao.
„Ljudi postave nekoliko upita u par minuta, a agenti stotine ili tisuće u sekundi samo da bi prikupili informacije za odluku”, rekao je suosnivač i direktor Andre Zayarni.
Problem koji memorija ne može riješiti
Agenti barataju podacima izvan vremena treniranja modela: povjerljivim dokumentima, često mijenjanom poslovnom građom i aktualnim informacijama. Prošireni kontekst zadržava stanje razgovora, ali ne jamči kvalitetan, visokorecallni pretraživački sloj ni stabilnost pri ogromnim opterećenjima. Zayarni tvrdi da „većina okvira za memoriju ionako koristi neku vrstu vektorskog spremišta”, što znači da se ispod površine ipak krije specijalizirana tražilica.
Tri tipična kvara pojavljuju se kad taj sloj nije namjenski građen:
- Promašeni rezultat na razini dokumenta prelazi iz pitanja brzine u pitanje točnosti odluke.
- Kod velikog broja upisa relevantnost opada jer novi podaci ulaze u neoptimizirane segmente.
- Usko grlo samo jednog replika čitav agentni ciklus gura u kašnjenje koje čovjek još može tolerirati, ali agent ne.
Novosti u izdanju 1.17 izravno ciljaju te točke: povratna sprega relevantnosti poboljšava recall bez ponovnog treniranja ugrađivačkog modela; „delayed fan-out” šalje upit drugom repliku kad prvi prekorači prag latencije; telemetrijski API na razini klastera zamjenjuje mukotrpno provjeravanje čvora po čvor.
„Nismo baza, mi smo tražilica”
Zayarni smatra da je sama podrška za vektore postala higijenski minimum u gotovo svim bazama: „Ako vam je kvaliteta pretrage presudna, treba vam tražilica.” Njegov savjet početnicima glasi: krenite s onim što već imate, a prebacite se na posebnu platformu kad vas na to prisili skala.
Rustom pisana arhitektura Qdranta donosi manju potrošnju memorije i finiju kontrolu performansi, a otvoreni kod omogućuje zajednici da pogura razvoj brže nego što bi to interno financiranje ikad moglo.
Kad općenite baze više ne prate
Dva produkcijska primjera ilustriraju granice univerzalnih rješenja:
• GlassDollar pretražuje milijune startup-profila za klijente poput Siemensa. Svaki korisnički upit razbija u više paralelnih podupita, tipičan agentni obrazac koji je tvrtku natjerao da Elasticsearch zamijeni Qdrantom pri približavanju desetmilijunskoj zbirci dokumenata. Rezultat: 40 % niži troškovi infrastrukture, trostruko veća angažiranost korisnika i ukidanje dodatnog sloja keyword-kompenzacije. „Ako se najbolje tvrtke ne pojave u rezultatima, korisnik gubi povjerenje”, kaže Kamen Kanev iz GlassDollara.
• &AI razvija agenta Andyja za patentne sporove koji semantički pretražuje stotine milijuna dokumenata iz više jurisdikcija. „Cijela nam je arhitektura dizajnirana da rizik halucinacija svedemo na minimum stavljajući dohvat ispred generiranja”, ističe osnivač Herbie Turner.
Signali za prelazak na specijalizirano rješenje
Prema iskustvu tih timova, tri su jasna crvena svjetla:
- Poslovni ishod izravno ovisi o potpunosti pretrage.
- Upiti se granaju, re-rangiraju u više faza ili koriste paralelne alate.
- Količina podataka prelazi desetke milijuna dokumenata.
Kad se to dogodi, ključna pitanja postaju vidljivost nad distribucijom i „headroom” za rast opterećenja koje autonomni agenti neprestano generiraju. Kanev zaključuje: „Za proizvode gdje je kvaliteta dohvaćanja sam proizvod, promašeni rezultat znači stvarni gubitak — zato vam treba posvećena tražilica.”