Industrija gen-AI-ja u posljednje je dvije godine prošla naglu otrježnjujuću fazu: oko 95 % organizacija koje su investirale u projekte temeljem velikih jezičnih modela još uvijek ne bilježi mjerljiv povrat. Jedan od najglasnijih znakova posrtanja jest sudbina specijaliziranih vector baza podataka – nekada slavljenih kao „sljedeći veliki sloj“ infrastrukture, danas tek jedne od stavki u širem, hibridnom tech-stogu.
Najpoznatiji primjer pregrijanih očekivanja je američki Pinecone. Tvrtka je godinama slovila za budućeg jednoroga, no sada, prema insajderskim informacijama, aktivno traži kupca nakon što ju je pritisnula konkurencija i odliv korisnika. Početkom rujna 2025. osnivač Edo Liberty povukao se na poziciju glavnog znanstvenika, a kormilo je preuzeo Ash Ashutosh – potez koji mnogi tumače kao pokušaj spašavanja samostalnosti prije eventualne akvizicije.
Sličan pritisak osjećaju i ostali specijalisti: Weaviate, Chroma, Qdrant ili Milvus sve teže se diferenciraju dok tradicionalne baze podataka – od PostgreSQL-a (pgVector) i MySQL HeatWavea do Elasticsearcha i Redisa – jednostavno dodaju vektorsku funkcionalnost kao još jednu „kućicu“ u ponudi. Za mnoge klijente to je dovoljno; pitaju se zašto bi uvodili posve novi sustav ako postojeći već radi „dovoljno dobro“.
Lekcija točnosti Jedan od glavnih razloga razočaranja leži u prirodi samih vektora. Tražite li, primjerice, „Grešku 221“ u tehničkom priručniku, čisto semantičko pretraživanje rado će vratiti i „Grešku 222“ jer je „dovoljno slična“. U demo-videu to izgleda impresivno, ali u produkciji može biti kobno. Zato su razvojni timovi ubrzo vratili klasični leksički (ključni) upit u kombinaciju s vektorima, dodali metapodatkovno filtriranje, rerankere i ručna pravila. Konsenzus 2025. glasi: vektori jesu moćni, ali samo kao dio hibridnog sustava.
Komoditizacija i novi trendovi Eksplozija start-upova specijaliziranih za vector bazu pokazala se kratkog daha. Danas je vektorsko pretraživanje „checkbox“ u oblaku ili enterprise DB-u, a prava inovacija seli na višu razinu – u orkestraciju različitih metoda dohvaćanja znanja.
Najbrže rastući pojam u tom kontekstu je GraphRAG – grafom potpomognuta retrieval-augmented generation. Spajanjem vektorskih reprezentacija s relacijama iz znanja grafova, GraphRAG čuva odnose koje vektori inače „spljošte“. Unutarnja testiranja u financijskom, zdravstvenom i pravnom domenu pokazuju skok točnosti odgovora sa 50 % na više od 80 %. Novi, javno dostupni benchmark GraphRAG-Bench iz svibnja 2025. isti trend potvrđuje na višekoracnim upitima i zadacima rezoniranja.
Budućnost dohvaćanja Stručnjaci očekuju da će se velike baze i cloud platforme ubrzo isporučivati s integriranim paketom: vektor + graf + full-text, sve u jednoj konzoli. Sljedeći korak bit će „retrieval engineering“ – zasebna disciplina koja će spajati fino podešavanje embeddinga, hibridno rangiranje i automatizirano građenje domennih grafova. U takvom okruženju vector baza podataka postaje nužno, ali nipošto dostatno rješenje; ključni adut bit će sloj koji pametno bira kada koristiti koju tehniku.
Vrijeme „jednoroga“ iz vektorskog svijeta očito je prošlo. Ono što ostaje jest temeljna lekcija: semantika bez preciznosti nije dovoljna, a pravo se zlato krije u kombinaciji pristupa. Ukratko, jednorog budućnosti nije pojedinačna baza – to je cjelokupan, dobro orkestriran sustav za pouzdano prizemljenje generativne umjetne inteligencije u činjenicama i poslovnim procesima.