Google Cloud predstavio je Vertex AI Training, novu uslugu namijenjenu organizacijama koje žele trenirati potpuno prilagođene generativne modele umjesto da tek dorađuju postojeće.
Usluga nudi:
• pristup velikom rasponu GPU-a i drugih čipova sposobnih za masovno paralelno treniranje; • upravljano Slurm okruženje koje automatski brine o raspoređivanju poslova, čuvanju kontrolnih točaka i ponovnom pokretanju u slučaju kvara; • dodatne alate za znanost o podacima i praćenje procesa treniranja.
„What we're seeing is that there's an increasing number of companies that are building or customizing large gen AI models to introduce a product offering built around those models, or to help power their business in some way”, poručio je Jaime de Guerre, stariji direktor za upravljanje proizvodima u Google Cloudu.
Vertex AI Training cilja na dugotrajne poslove koji mogu obuhvatiti stotine ili tisuće čipova, a cijena ovisi o količini potrebnog računalnog kapaciteta. De Guerre naglašava da usluga nije namijenjena metodama poput RAG-a ili lakog finog podešavanja, nego "to train a model where you might start from completely random weights".
Googleov potez stavlja ga u izravnu konkurenciju s ponudama poput CoreWeavea, Lambda Labsa te cloud divova AWS-a i Microsoft Azurea. Prednost, ističu u Googleu, proizlazi iz pristupa širokoj lepezi čipova i iskustva stečenog tijekom treniranja vlastitih Gemini modela.
Među prvim korisnicima nalaze se AI Singapore, koji je na platformi izgradio 27-milijardni model SEA-LION v4, te istraživački tim Salesforcea. Za tvrtke koje trebaju specifične jezične ili industrijske modele, Vertex AI Training mogao bi ukloniti najveću prepreku – nedostatak dostupnih GPU-a – i učiniti razvoj vlastitog LLM-a izvedivim bez ulaganja u skupi interni hardver.
De Guerre dodatno ističe da upravljano okruženje „help with all the job scheduling and automatic recovery of jobs failing”, čime se skraćuju zastoje i povećava učinkovitost velikih klastera.
Ipak, mogućnost izgradnje modela od nule neće odgovarati svim organizacijama; za mnoge će i dalje biti isplativije nadograditi postojeći model. No za one sa specifičnim potrebama – od financijske industrije do lokalnih jezičnih zajednica – nova Googleova usluga otvara vrata potpunoj prilagodbi bez kompromisa u performansama.