Tehnologija

20. studenog 2025, 20:25

ScaleOps predstavlja rješenje za upravljanje GPU-ima i rezanje troškova samostalno hostanih LLM-ova

Novi ScaleOpsov AI Infra Product korisnicima obećava do 70 % niže račune za GPU i brže odzive velikih jezičnih modela, bez promjena u postojećem kodu ili infrastrukturi.

min. čitanja

ScaleOps je proširio svoju platformu za upravljanje cloud resursima novim proizvodom namijenjenim tvrtkama koje pokreću vlastite modele velikih jezika i druge GPU-intenzivne AI aplikacije. AI Infra Product, kako ga naziva tvrtka, već radi u produkcijskim okruženjima te, prema internim brojkama, smanjuje troškove GPU-a između 50 i 70 %.

„Cloud-native arhitekture donijele su fleksibilnost i kontrolu, ali i novu razinu složenosti”, rekao je suosnivač i izvršni direktor ScaleOpsa Yodar Shafrir. „Managing GPU resources at scale has become chaotic—waste, performance issues, and skyrocketing costs are now the norm.”

Ključne značajke • Platforma u stvarnom vremenu dodjeljuje i skalira GPU resurse, prilagođavajući se prometnim šiljcima bez promjena u postojećem kodu ili deployment pipelineu. • Radi na svim Kubernetes distribucijama te u oblaku, podatkovnim centrima i zračnim jazovima. • Instalacija se, prema ScaleOpsu, svodi na „dvominutni” postupak uz jedan Helm flag, a optimizacija se uključuje jednim potezom.

Shafrir naglašava da sustav koristi „proactive and reactive mechanisms to handle sudden spikes without performance impact” i da „ensures instant response when traffic surges”, čime smanjuje hladni start velikih modela. Platforma ne mijenja manifeste niti remetí postojeće raspoređivače, već „enhances schedulers, autoscalers, and custom policies by incorporating real-time operational context”.

U praksi, ScaleOps klijentima nudi punu vidljivost iskorištenosti GPU-a i ponašanja modela na razini podova, workloada, čvorova i klastera, uz mogućnost finog podešavanja zadanih politika skaliranja.

Rezultati ranih korisnika • Kreativni softverski div s tisućama GPU-ova povisio je prosječnu iskorištenost s 20 % na znatno višu razinu, konsolidirao neiskorištene resurse i prepolovio troškove, istodobno spuštajući latenciju za 35 %. • Globalna gaming kompanija, koja na stotine GPU-ova izvršava dinamičan LLM workload, povećala je iskorištenost sedmerostruko i projicira 1,4 milijuna dolara godišnje ušteđenih troškova.

Tvrtka ne objavljuje javni cjenik: potencijalni kupci dobivaju ponudu prilagođenu veličini i potrebama infrastrukture. ScaleOps tvrdi da uštede na GPU-ovima nadmašuju cijenu korištenja platforme, što, kako kažu, potvrđuju i korisnici s ograničenim budžetima.

S rastom broja samostalno hostanih AI modela, složeno upravljanje GPU-ovima postaje jedna od najvećih prepreka za korporacije. ScaleOps ovim proizvodom nastoji ponuditi objedinjeni, automatizirani odgovor na taj izazov i, kako navodi Shafrir, „complete solution for managing and optimizing GPU resources in cloud-native environments”.

#kubernetes #scaleops #yodar-shafrir #helm

Slično

Tehnologija

Lightfield lansirao AI CRM i izazvao Salesforce i HubSpot

Startup iz San Francisca predstavio AI CRM koji automatizira unos podataka i cilja korisnike nezadovoljne tradicionalnim sustavima.

min čitanja

Više

Tehnologija

Olmo 3 otvara vrata prilagodljivim AI modelima uz potpunu transparentnost

Ai2 predstavlja Olmo 3, obitelj otvorenih jezičnih modela s dužim kontekstom i naglaskom na potpunu transparentnost i prilagodbu za poslovne korisnike.

min čitanja

Više

Tehnologija

Cisco alarmira: zastarjela mrežna oprema postaje sve veća sigurnosna rupa

Tehnološki div pokreće program „Resilient Infrastructure” i obećava radikalniji obračun sa zastarjelom mrežnom opremom koja otvara vrata kibernetičkim napadima.

min čitanja

Više

Tehnologija

Francuski tužitelji istražuju Muskove platforme zbog negiranja holokausta

AI chatbot Grok negirao je holokaust, zbog čega je sadržaj uključen u postojeću kaznenu istragu protiv društvene mreže X u Francuskoj.

min čitanja

Više

Tehnologija

Nova fronta protiv raka: cijelotjelesni MRI i tekuća biopsija nude raniji signal opasnosti

Magnetna rezonanca cijelog tijela i sofisticirane tekuće biopsije sve su bliže statusu rutinskih pregleda koji mogu otkriti tumor u samom začetku.

min čitanja

Više

Tehnologija

Google DeepMind dovodi bivšeg CTO-a Boston Dynamicsa kako bi ubrzao razvoj robotike

Dolazak Aarona Saundersa iz Boston Dynamicsa signalizira novu fazu DeepMindove ambicije da Geminija pretvori u univerzalni „operativni sustav” za robote.

min čitanja

Više

Tehnologija

Huang odbacuje priče o AI balonu, Nvidia prijavila rekordnu prodaju i najavila nova ulaganja

Izvršni direktor Jensen Huang tvrdi da je potražnja za Nvidia čipovima daleko od vrhunca dok kompanija prijavljuje 57 milijardi USD prihoda i sklapa nove AI partnerstva.

min čitanja

Više

Tehnologija

NASA potvrdila: 3I/ATLAS je međuzvjezdani komet

Američka svemirska agencija objavila je da je 3I/ATLAS treći potvrđeni međuzvjezdani objekt, a najbliže Zemlji proći će 19. prosinca 2025. na sigurnoj udaljenosti od 267 milijuna kilometara.

min čitanja

Više

Tehnologija

Šef Palantira brani ugovore s vladama unatoč kritikama

Alex Karp tvrdi da je dužnost tehnoloških firmi raditi s demokratskim vladama, dok kritičari Palantiru spočitavaju poticanje nadzora i potencijalna kršenja ljudskih prava.

min čitanja

Više

Tehnologija

Memo donosi kavu: kućni robot iz Kalifornije obećava kraj dosadnih kućanskih poslova

Memo, simpatični robot na kotačima tvrtke Sunday Robotics, već spravlja kavu i slaže čaše u perilicu, a iduće godine kreće u testiranje kod prvih kućnih korisnika.

min čitanja

Više

Tehnologija

20. studenog 2025, 20:25

ScaleOps predstavlja rješenje za upravljanje GPU-ima i rezanje troškova samostalno hostanih LLM-ova

Novi ScaleOpsov AI Infra Product korisnicima obećava do 70 % niže račune za GPU i brže odzive velikih jezičnih modela, bez promjena u postojećem kodu ili infrastrukturi.

min. čitanja

#kubernetes #scaleops #yodar-shafrir #helm

Slično

Tehnologija

Lightfield lansirao AI CRM i izazvao Salesforce i HubSpot

Startup iz San Francisca predstavio AI CRM koji automatizira unos podataka i cilja korisnike nezadovoljne tradicionalnim sustavima.

min čitanja

Više

Tehnologija

Olmo 3 otvara vrata prilagodljivim AI modelima uz potpunu transparentnost

Ai2 predstavlja Olmo 3, obitelj otvorenih jezičnih modela s dužim kontekstom i naglaskom na potpunu transparentnost i prilagodbu za poslovne korisnike.

min čitanja

Više

Tehnologija

Cisco alarmira: zastarjela mrežna oprema postaje sve veća sigurnosna rupa

Tehnološki div pokreće program „Resilient Infrastructure” i obećava radikalniji obračun sa zastarjelom mrežnom opremom koja otvara vrata kibernetičkim napadima.

min čitanja

Više

Tehnologija

Francuski tužitelji istražuju Muskove platforme zbog negiranja holokausta

AI chatbot Grok negirao je holokaust, zbog čega je sadržaj uključen u postojeću kaznenu istragu protiv društvene mreže X u Francuskoj.

min čitanja

Više

Tehnologija

Nova fronta protiv raka: cijelotjelesni MRI i tekuća biopsija nude raniji signal opasnosti

Magnetna rezonanca cijelog tijela i sofisticirane tekuće biopsije sve su bliže statusu rutinskih pregleda koji mogu otkriti tumor u samom začetku.

min čitanja

Više

Tehnologija

Google DeepMind dovodi bivšeg CTO-a Boston Dynamicsa kako bi ubrzao razvoj robotike

Dolazak Aarona Saundersa iz Boston Dynamicsa signalizira novu fazu DeepMindove ambicije da Geminija pretvori u univerzalni „operativni sustav” za robote.

min čitanja

Više

Tehnologija

Huang odbacuje priče o AI balonu, Nvidia prijavila rekordnu prodaju i najavila nova ulaganja

Izvršni direktor Jensen Huang tvrdi da je potražnja za Nvidia čipovima daleko od vrhunca dok kompanija prijavljuje 57 milijardi USD prihoda i sklapa nove AI partnerstva.

min čitanja

Više

Tehnologija

NASA potvrdila: 3I/ATLAS je međuzvjezdani komet

Američka svemirska agencija objavila je da je 3I/ATLAS treći potvrđeni međuzvjezdani objekt, a najbliže Zemlji proći će 19. prosinca 2025. na sigurnoj udaljenosti od 267 milijuna kilometara.

min čitanja

Više

Tehnologija

Šef Palantira brani ugovore s vladama unatoč kritikama

Alex Karp tvrdi da je dužnost tehnoloških firmi raditi s demokratskim vladama, dok kritičari Palantiru spočitavaju poticanje nadzora i potencijalna kršenja ljudskih prava.

min čitanja

Više

Tehnologija

Memo donosi kavu: kućni robot iz Kalifornije obećava kraj dosadnih kućanskih poslova

Memo, simpatični robot na kotačima tvrtke Sunday Robotics, već spravlja kavu i slaže čaše u perilicu, a iduće godine kreće u testiranje kod prvih kućnih korisnika.

min čitanja

Više