Amazon Web Services (AWS) pustio je u opću dostupnost uslugu Amazon S3 Vectors, čime je u svoju najkorišteniju objektnu pohranu dodao izvorno spremanje i pretraživanje vektorskih podataka.
• Kapacitet: do 2 milijarde vektora u jednom indeksu i čak 20 bilijuna po spremniku (bucketu). • Performanse: tipična latencija oko 100 ms za česte upite; rijetki upiti završavaju ispod jedne sekunde. • Propusnost zapisa: do 1 000 operacija PUT u sekundi za pojedinačne vektore. • Cijena: AWS tvrdi do 90 % niže troškove pohrane i pretraživanja u odnosu na specijalizirane vektorske baze podataka.
„Kupci biraju između S3 Vectors i vektorske baze ovisno o potrebnoj latenciji aplikacije”, poručila je Mai-Lan Tomsen Bukovec, potpredsjednica za tehnologiju u AWS-u, usporedivši S3 s „hladnijim” slojem pohrane, a baze poput Amazon OpenSearcha s „vrućim” performansnim slojem.
Tvrtke su u četveromjesečnom pretpregledu kreirale više od 250 000 indeksa i učitale preko 40 milijardi vektora. Nakon proširenja kapaciteta, AWS očekuje da će organizacije moći konsolidirati cijele vektorske skupove podataka u jedan indeks umjesto da ih razbijaju po infrastrukturi.
PODJELA POSLOVA S3 Vectors cilja radna opterećenja koja mogu tolerirati stotinjak milisekundi kašnjenja: semantičko pretraživanje velikih dokumenata, proširenje memorije AI agenata ili batch analitiku nad urezima. Za sustave u kojima korisnik uživo čeka odgovor — primjerice preporučivačke motore s tisućama paralelnih upita — i dalje su potrebne specijalizirane vektorske baze.
To potvrđuje i tržište. Jeff Zhu iz Pineconea ističe da ta baza na dediciranim čvorištima postiže 5 700 upita u sekundi nad 1,4 milijarde vektora uz latenciju od 26 do 60 ms, „što S3 zasad ne dostiže”.
Analitičar Corey Quinn na društvenoj mreži X sažeo je trend: „Vektor je značajka, ne proizvod.” Holger Mueller upozorava da će se specijalizirani dobavljači morati jasno diferencirati: „Paketi (suiteovi) u poslovnom softveru uvijek na kraju pobijede.” Ed Anderson iz Gartnera dodaje da će S3 Vectors povećati vrijednost postojećim korisnicima AWS-a, ali „neće ukloniti potrebu za vektorskim bazama tamo gdje je ključna niska latencija i visoka postojanost performansi”.
PRVI KORACI, DUGI PLANOVI Bukovec naglašava da je ovo tek početak: „Poboljšavat ćemo i skalabilnost i performanse S3 Vectorsa, kao što smo godinama ubrzavali čitanje i pisanje video-zapisa ili Parquet datoteka na S3-u.”
Za arhitekte to znači hijerarhiju pohrane nalik dosadašnjim podatkovnim jezerima: skupi, brzi sloj za interaktivne upite; jeftiniji, izdašan sloj za masovno spremanje i manje kritične operacije. U svijetu generativne umjetne inteligencije vektori su nov, ali sveprisutan podatkovni tip — a AWS je upravo učinio da dom zarade pronađu ondje gdje već stanuje golema većina korporativnih podataka.