CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

20. studenog 2025, 20:25

ScaleOps predstavlja rješenje za upravljanje GPU-ima i rezanje troškova samostalno hostanih LLM-ova

Novi ScaleOpsov AI Infra Product korisnicima obećava do 70 % niže račune za GPU i brže odzive velikih jezičnih modela, bez promjena u postojećem kodu ili infrastrukturi.

min. čitanja

XFacebookWhatsApp

ScaleOps je proširio svoju platformu za upravljanje cloud resursima novim proizvodom namijenjenim tvrtkama koje pokreću vlastite modele velikih jezika i druge GPU-intenzivne AI aplikacije. AI Infra Product, kako ga naziva tvrtka, već radi u produkcijskim okruženjima te, prema internim brojkama, smanjuje troškove GPU-a između 50 i 70 %.

„Cloud-native arhitekture donijele su fleksibilnost i kontrolu, ali i novu razinu složenosti”, rekao je suosnivač i izvršni direktor ScaleOpsa Yodar Shafrir. „Managing GPU resources at scale has become chaotic—waste, performance issues, and skyrocketing costs are now the norm.”

Ključne značajke • Platforma u stvarnom vremenu dodjeljuje i skalira GPU resurse, prilagođavajući se prometnim šiljcima bez promjena u postojećem kodu ili deployment pipelineu. • Radi na svim Kubernetes distribucijama te u oblaku, podatkovnim centrima i zračnim jazovima. • Instalacija se, prema ScaleOpsu, svodi na „dvominutni” postupak uz jedan Helm flag, a optimizacija se uključuje jednim potezom.

Shafrir naglašava da sustav koristi „proactive and reactive mechanisms to handle sudden spikes without performance impact” i da „ensures instant response when traffic surges”, čime smanjuje hladni start velikih modela. Platforma ne mijenja manifeste niti remetí postojeće raspoređivače, već „enhances schedulers, autoscalers, and custom policies by incorporating real-time operational context”.

U praksi, ScaleOps klijentima nudi punu vidljivost iskorištenosti GPU-a i ponašanja modela na razini podova, workloada, čvorova i klastera, uz mogućnost finog podešavanja zadanih politika skaliranja.

Rezultati ranih korisnika • Kreativni softverski div s tisućama GPU-ova povisio je prosječnu iskorištenost s 20 % na znatno višu razinu, konsolidirao neiskorištene resurse i prepolovio troškove, istodobno spuštajući latenciju za 35 %. • Globalna gaming kompanija, koja na stotine GPU-ova izvršava dinamičan LLM workload, povećala je iskorištenost sedmerostruko i projicira 1,4 milijuna dolara godišnje ušteđenih troškova.

Tvrtka ne objavljuje javni cjenik: potencijalni kupci dobivaju ponudu prilagođenu veličini i potrebama infrastrukture. ScaleOps tvrdi da uštede na GPU-ovima nadmašuju cijenu korištenja platforme, što, kako kažu, potvrđuju i korisnici s ograničenim budžetima.

S rastom broja samostalno hostanih AI modela, složeno upravljanje GPU-ovima postaje jedna od najvećih prepreka za korporacije. ScaleOps ovim proizvodom nastoji ponuditi objedinjeni, automatizirani odgovor na taj izazov i, kako navodi Shafrir, „complete solution for managing and optimizing GPU resources in cloud-native environments”.

#kubernetes#scaleops#yodar-shafrir#helm

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Portugal predstavio prvu europsku „poslovnu lisnicu”
Portugal je prvi u EU pustio u rad digitalnu „poslovnu lisnicu”, a Bruxelles projekt vidi kao korak prema uklanjanju birokratskih prepreka. Estonija pak upozorava na visoke troškove i preklapanje sustava.

min čitanja

Više

Tehnologija

Global Game Jam ponovno u Rijeci: 48 sati za stvaranje više od 20 videoigara
Sedmo izdanje Global Game Jama u Rijeci okupit će stotinjak entuzijasta koji će u 48 sati osmisliti i izraditi više od 20 novih videoigara.

min čitanja

Više

Tehnologija

Crikvenička škola organizira znanstveno popodne o analitici učenja
U utorak, 3. veljače, izv. prof. dr. sc. Ivan Dražić u Crikvenici govori o ranoj detekciji školskih poteškoća pomoću analitike učenja.

min čitanja

Više

Tehnologija

AI agenti reprogramiraju SOC: od sati do minuta odgovora
Rast broja upozorenja gura sigurnosne operativne centre prema nadziranim AI agentima, ali uspjeh ovisi o jasnim granicama i ljudskoj kontroli.

min čitanja

Više

Tehnologija

Intelov Panther Lake donosi najveći skok u godinama
Panther Lake, službeno Intel Core Ultra Series 3, prvi put u pet godina donosi značajan skok performansi i vraća samopouzdanje Intelu.

min čitanja

Više

Tehnologija

Radnici Google DeepMinda traže zaštitu od ICE-a nakon smrtonosne intervencije agenata
Zaposlenici AI odjela Google DeepMind traže od uprave mjere zaštite od ICE-a, navodeći smrtonosni incident u Minneapolisu i pokušaj neovlaštenog ulaska agenta u ured u Cambridgeu.

min čitanja

Više

Tehnologija

Meta blokirao poveznice na stranicu s popisom djelatnika ICE-a
Facebook, Instagram i Threads brišu linkove na ICE List, stranicu koja objavljuje javno dostupne podatke o djelatnicima američkog DHS-a, dok WhatsApp zasad ostaje iznimka.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Startup nudi rješenje za najveće usko grlo poslovne umjetne inteligencije
Contextual AI predstavio Agent Composer, platformu koja uz RAG pristup rješava problem konteksta i skraćuje složene zadatke s nekoliko sati na minute.

min čitanja

Više

Tehnologija

Američki tužitelji kreću protiv xAI zbog seksualiziranih slika koje je generirao Grok
Čak 37 američkih državnih odvjetnika pokrenulo je istrage i postupke protiv xAI-a zbog navodnog širenja seksualiziranih slika koje je generirao chatbot Grok.

min čitanja

Više

Tehnologija

Kineski Moonshot AI predstavio Kimi K2.5: najjači otvoreni model nadmašuje vodeće rivale
Moonshot AI nadogradio je svoj otvoreni LLM u verziju Kimi K2.5, dodavši vizualno kodiranje i orkestraciju agenata, te na ključnim testovima prestigao vodeće komercijalne modele.

min čitanja

Više

Najčitanije

Vijesti

Povlači se jedna serija Aptamilove hrane za dojenčad zbog mogućeg toksina
Serija hrane „Aptamil AR 2” povlači se s hrvatskog tržišta zbog mogućeg toksina cereulida; opoziv se odnosi samo na pakiranja od 400 g s rokom uporabe 2. siječnja 2027.

min čitanja

Više

Vijesti

Požar u Courchevelu: luksuzni hotel gorio satima, evakuirane stotine gostiju
Vatra je planula na tavanu petozvjezdanog hotela „Des Grandes Alpes” u Courchevelu; evakuirano oko 300 gostiju iz dva objekta, a na terenu je 131 vatrogasac.

min čitanja

Više

Vijesti

Pala skupina krijumčara: osmero uhićenih, zaplijenjeno 150 kg kokaina i 200 kg marihuane
Koordinirana akcija USKOK-a i policije rezultirala je uhićenjem osmero ljudi, među kojima je i jedan policajac, zbog sumnje na krijumčarenje 150 kilograma kokaina i 200 kilograma marihuane.

min čitanja

Više

Najnovije

Vijesti

Istarski 43-godišnjak završio u istražnom zatvoru zbog sumnje na obiteljsko nasilje i silovanje

Lifestyle

Film „Melania” stiže u kina i ponovno otvara pitanje tko je zapravo prva dama

Sport

Chelsea upozorava navijače u Napulju nakon napada: dvojica završila u bolnici

Biznis

Luka Pula dobila novu upravu i nadzornika

Lifestyle

Thompson najavio koncert u Širokom Brijegu, fanovi oduševljeni objavom

Politika

Trump na zid Bijele kuće stavio fotografiju s Putinom

Biznis

Povrat poreza za mlade ne blokira prodaju ili najam, ali državni novac treba vratiti

Politika

Veterani iz Možemo! u filmu „Branili smo slobodu“ govore o ratnoj stigmi

Biznis

Ekološka poljoprivreda stagnira: Hrvatska propušta šansu za proizvode više vrijednosti

Vijesti

Na Viru već postavljeno 20 od planiranih 61 ležećih policajaca

Lifestyle

Ivanka Trump zapravo se zove Ivana: nadimak nastao iz češke tradicije