Generativni modeli umjetne inteligencije u poduzećima sve se češće oslanjaju na takozvani Retrieval-Augmented Generation (RAG) – mehanizam koji velikim jezičnim modelima daje uvid u interne baze podataka. No, kako se pokazuje, sama sposobnost dohvaćanja informacija više nije luksuzna nadogradnja, nego kritična infrastrukturna ovisnost.
Glavni problem: svježina podataka
Autor stručne analize upozorava da se većina pogrešaka ne rađa u modelu embeddingsa, nego u okolnom sustavu. Prespore reindeksacije, neuređeni putevi pristupa i loše procijenjeni upiti rezultiraju „ustajalim” kontekstom – odgovorima koji mogu biti netočni, ali svejedno djeluju uvjerljivo. Posljedica nisu samo slabiji rezultati pretrage, nego i ozbiljan poslovni rizik: narušeno povjerenje korisnika, problemi s usklađenošću te prekidi u operativnim procesima.
Što poduzeća najčešće ne znaju odgovoriti:
- Koliko vremena prođe od promjene izvornog dokumenta do ažuriranja indeksa?
- Koji odjeli i dalje povlače zastarjele verzije?
- Postoje li jamstva u slučaju da se podaci promijene usred korisničke sesije?
Sustav, a ne aplikacija
Analiza predlaže da se dohvat tretira kao infrastrukturni sloj ravnopravan računalnoj snazi, mreži i pohrani. Zrele platforme, navodi se, rješavaju pitanje svježine pomoću: • događajnog reindeksiranja umjesto periodičnih „velikih obnova” • verzioniranih embeddingsa koji jasno označavaju generaciju podataka • svijesti o starenju podataka već u trenutku upita, čime se korisnika upozorava na moguće odstupanje
Za arhitekte, voditelje AI-platformi i timove zadužene za podatkovnu infrastrukturu poruka je jasna: dizajnirajte sustav evaluacije, upravljanja pristupom i osvježavanja indeksa jednako strogo kao što se desetljećima dizajniraju mreže ili diskovna polja. U suprotnom, generativna inteligencija može od pomoći vrlo brzo postati skupa slabost.