Utrka za pouzdanim preuzimanjem podataka unutar agentičkih i RAG sustava dobila je novo poglavlje: kompanija MongoDB predstavila je čak četiri inačice svog novog modela za ugrađene vektore i reranking – Voyage 4.
Četiri lica istog modela • voyage-4 embedding – opća namjena, namijenjen širokom rasponu aplikacija. • voyage-4-large – perjanica ponude s najboljim performansama. • voyage-4-lite – optimiziran za nisku latenciju i manji trošak. • voyage-4-nano – prilagođen lokalnom razvoju, testnim okruženjima ili izravnom radu na uređaju; ujedno i prvi MongoDB-jev model otvorenih težina.
Svi modeli dostupni su putem API-ja te na platformi Atlas. Tvrtka tvrdi da Voyage 4 na referentnom testu RTEB Hugging Facea prestiže usporedive modele Googlea i Coherea, zauzevši prvo mjesto među ugrađenim vektorima.
„Embedding modeli su jedan od onih nevidljivih izbora koji mogu napraviti ili slomiti AI iskustvo. Pogriješite li, rezultati pretraživanja djelovat će nasumično i površno; pogodite li, aplikacija odjednom izgleda kao da razumije korisnike i podatke”, rekao je voditelj proizvoda Frank Liu. Dodao je da su modeli osmišljeni kako bi spriječili pad kvalitete preuzimanja podataka koji se često pojavljuje kad agentičke i RAG cijevi pređu iz prototipa u produkciju.
Multimodalni iskorak Uz seriju Voyage 4, MongoDB je lansirao i voyage-multimodal-3.5 – model sposoban obraditi dokumente koji kombiniraju tekst, slike i videozapise. Sustav vektorizira sadržaj i izvlači semantičko značenje iz tablica, grafova, slajdova i drugih tipičnih elemenata korporativnih dokumenata.
Poboljšani modeli trebali bi smanjiti pogreške, ubrzati rad i povećati povjerenje korisnika u AI rješenja koja ovise o točnom i brzom pretraživanju podataka.