Američki div računalnog oblaka Amazon Web Services (AWS) najavio je niz značajnih nadogradnji za svoj strojno-učeći servis SageMaker, nastojeći zadržati prednost pred konkurentima Googleom i Microsoftom u sve žešćoj utrci za klijente iz područja umjetne inteligencije.
Glavne novosti • Nadzor performansi: nova funkcija SageMaker HyperPod observability prati svaki sloj okoline – od računalnih resursa do mreže – i, u slučaju usporavanja modela, automatski šalje upozorenja te prikazuje metrike na preglednoj nadzornoj ploči. • Povezivanje lokalnih razvojnih okruženja: sigurni mehanizam udaljenog izvršavanja omogućuje inženjerima da kod pišu u omiljenom lokalnom IDE-u, a zadatke pokreću na skalabilnoj infrastrukturi SageMakera, čime dobivaju „najbolje iz oba svijeta”. • Upravljanje GPU klasterima: proširen je HyperPod, lansiran krajem 2023., koji optimizira raspored korištenja grafičkih procesora prema obrascima potražnje. Osim treninga, sada inteligentno raspoređuje i inferencijske zadatke koji su često najzahtjevniji tijekom dnevnih vršnih opterećenja.
Što kažu iz AWS-a Generalni direktor SageMakera Ankur Mehrotra istaknuo je da su poboljšanja rezultat povratnih informacija korisnika: „One challenge that we’ve seen our customers face while developing Gen AI models is that when something goes wrong or when something is not working as per the expectation, it’s really hard to find what’s going on in that layer of the stack.” Kao primjer navodi interni slučaj gdje je nekontrolirano opterećenje GPU-a izazivalo temperaturne skokove; bez novih alata, otkrivanje uzroka trajalo bi tjednima.
Prednosti za tvrtke • Brže otkrivanje grešaka i stabilnije izvođenje modela. • Lakše prelijevanje neiskorištene računalne snage sa treninga na produkcijsku inferenciju. • Fleksibilniji radni proces za razvojne timove koji ne žele napustiti postojeće alate.
Pozitivna iskustva ranih korisnika potvrđuje i Laurent Sifre, suosnivač tvrtke H AI: „This seamless transition from training to inference streamlined our workflow, reduced time to production, and delivered consistent performance in live environments.”
Konkurentski pritisak Dok Microsoft svoje klijente privlači platformom Fabric, koju je već usvojilo 70 % kompanija s popisa Fortune 500, a Google širi Vertex AI, AWS se oslanja na titulu najraširenijeg pružatelja oblaka i strategiju „infrastruktura prije spektakla”. Osim SageMakera, kupcima nudi i servis Bedrock za izgradnju aplikacija i AI agenata.
Najnoviji dodatci SageMakeru – od dubljeg uvida u rad modela do fleksibilnog upravljanja GPU klasterima – trebali bi, prema Amazonu, učiniti upravo to: učvrstiti poziciju AWS-a kao okosnice na kojoj će poduzeća graditi sljedeću generaciju inteligentnih rješenja.