Google je unutar svog Gemini API-ja lansirao File Search, potpuno upravljani sustav za retrieval-augmented generation (RAG) koji tvrtkama obećava brže i jednostavnije povezivanje dokumenata s generativnim modelima.
„File Search provides a simple, integrated and scalable way to ground Gemini with your data, delivering responses that are more accurate, relevant and verifiable”, poručili su iz Googlea, ističući da novi alat uklanja potrebu za ručnim (i često nezgrapnim) spajanjem rješenja za pohranu, izradom embeddinga i podešavanjem vektorskih baza.
Ključne značajke • Automatsko upravljanje pohranom datoteka, strategijama ‘chunkanja’ i generiranjem embeddinga. • Pozivanje direktno kroz postojeći generateContent API, bez dodatne orkestracije. • Ugrađene citacije koje vode na konkretne odlomke iz dokumenata. • Podrška za najčešće formate, među ostalim: PDF, DOCX, TXT, JSON te brojne programske datoteke.
Cjenik i model naplate Korisnici mogu besplatno koristiti pohranu i stvaranje embeddinga u trenutku upita, dok se indeksiranje naplaćuje 0,15 USD za milijun tokena. Google tako pokušava privući poduzeća koja su već započela graditi vlastite (često skupe) RAG cjevovode s vanjskim alatima poput vektorskih baza podataka.
Utrka s konkurencijom File Search izravno se suprotstavlja sličnim ponudama OpenAI-a, AWS-a i Microsofta, no Google tvrdi da njegova platforma „abstrahira sve, a ne samo dio” procesa izgradnje RAG-a.
Primjena u praksi Phaser Studio, razvijač platforme za generiranje igara Beam, među prvima je isprobao novi servis. „File Search allows us to instantly surface the right material, whether that’s a code snippet for bullet patterns, genre templates or architectural guidance from our Phaser ‘brain’ corpus. The result is ideas that once took days to prototype now become playable in minutes”, rekao je tehnički direktor Richard Davey.
Interes tržišta Nakon objave alata, niz korisnika najavio je planove za integraciju File Searcha u vlastite AI agente kako bi skratili vrijeme postavljanja i održavanja RAG sustava. Industrija će sada pratiti hoće li Googleova strategija ‘sve-u-jednom’ doista ubrzati implementacije i smanjiti troškove u odnosu na konkurentska rješenja.