CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

20. studenog 2025, 20:25

ScaleOps predstavlja rješenje za upravljanje GPU-ima i rezanje troškova samostalno hostanih LLM-ova

Novi ScaleOpsov AI Infra Product korisnicima obećava do 70 % niže račune za GPU i brže odzive velikih jezičnih modela, bez promjena u postojećem kodu ili infrastrukturi.

min. čitanja

XFacebookWhatsApp

ScaleOps je proširio svoju platformu za upravljanje cloud resursima novim proizvodom namijenjenim tvrtkama koje pokreću vlastite modele velikih jezika i druge GPU-intenzivne AI aplikacije. AI Infra Product, kako ga naziva tvrtka, već radi u produkcijskim okruženjima te, prema internim brojkama, smanjuje troškove GPU-a između 50 i 70 %.

„Cloud-native arhitekture donijele su fleksibilnost i kontrolu, ali i novu razinu složenosti”, rekao je suosnivač i izvršni direktor ScaleOpsa Yodar Shafrir. „Managing GPU resources at scale has become chaotic—waste, performance issues, and skyrocketing costs are now the norm.”

Ključne značajke • Platforma u stvarnom vremenu dodjeljuje i skalira GPU resurse, prilagođavajući se prometnim šiljcima bez promjena u postojećem kodu ili deployment pipelineu. • Radi na svim Kubernetes distribucijama te u oblaku, podatkovnim centrima i zračnim jazovima. • Instalacija se, prema ScaleOpsu, svodi na „dvominutni” postupak uz jedan Helm flag, a optimizacija se uključuje jednim potezom.

Shafrir naglašava da sustav koristi „proactive and reactive mechanisms to handle sudden spikes without performance impact” i da „ensures instant response when traffic surges”, čime smanjuje hladni start velikih modela. Platforma ne mijenja manifeste niti remetí postojeće raspoređivače, već „enhances schedulers, autoscalers, and custom policies by incorporating real-time operational context”.

U praksi, ScaleOps klijentima nudi punu vidljivost iskorištenosti GPU-a i ponašanja modela na razini podova, workloada, čvorova i klastera, uz mogućnost finog podešavanja zadanih politika skaliranja.

Rezultati ranih korisnika • Kreativni softverski div s tisućama GPU-ova povisio je prosječnu iskorištenost s 20 % na znatno višu razinu, konsolidirao neiskorištene resurse i prepolovio troškove, istodobno spuštajući latenciju za 35 %. • Globalna gaming kompanija, koja na stotine GPU-ova izvršava dinamičan LLM workload, povećala je iskorištenost sedmerostruko i projicira 1,4 milijuna dolara godišnje ušteđenih troškova.

Tvrtka ne objavljuje javni cjenik: potencijalni kupci dobivaju ponudu prilagođenu veličini i potrebama infrastrukture. ScaleOps tvrdi da uštede na GPU-ovima nadmašuju cijenu korištenja platforme, što, kako kažu, potvrđuju i korisnici s ograničenim budžetima.

S rastom broja samostalno hostanih AI modela, složeno upravljanje GPU-ovima postaje jedna od najvećih prepreka za korporacije. ScaleOps ovim proizvodom nastoji ponuditi objedinjeni, automatizirani odgovor na taj izazov i, kako navodi Shafrir, „complete solution for managing and optimizing GPU resources in cloud-native environments”.

#kubernetes#scaleops#yodar-shafrir#helm

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Platforma InferenceSense pretvara mrtvo vrijeme GPU-ova u prihod
Startup FriendliAI lansirao je InferenceSense, sustav koji automatski preusmjerava neiskorištene GPU-ove na plaćene AI inferencije i prihod dijeli s operaterom.

min čitanja

Više

Tehnologija

Prvi AI plivački mlaz lansiran na Kickstarteru
iGarden na Kickstarteru nudi Swim Jet X Series, prvi prijenosni plivački mlaz kojim upravlja umjetna inteligencija, po početnoj cijeni od 799 USD.

min čitanja

Više

Tehnologija

Umjetna inteligencija ubrzava potragu za lijekovima: nova oružja protiv superbakterija i Parkinsona
Računalni algoritmi ubrzavaju otkrivanje novih antibiotika, potencijalnih terapija za Parkinsonovu bolest te otvaraju mogućnosti ponovne primjene postojećih lijekova, nudeći nadu milijunima pacijenata.

min čitanja

Više

Tehnologija

Google ne isključuje oglase u Gemini
Potpredsjednik Googlea Nick Fox kaže da se oglasi zasad neće pojaviti u AI-modelu Gemini, ali kompanija razmatra tu opciju za budućnost.

min čitanja

Više

Tehnologija

Iranski hakeri udarili na američku tvrtku Stryker: Handala najavljuje "novo doba kibernetskog rata"
Handala, za koju se vjeruje da je povezana s iranskom obavještajnom službom, tvrdi da je paralizirala Stryker u odmazdi za napade SAD-a i Izraela, upozoravajući na "novo doba kibernetskog rata".

min čitanja

Više

Tehnologija

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Ukrajina otvara bojišne podatke za treniranje savezničkih AI sustava
Ministar obrane Mihajlo Fedorov kaže da Kijev partnerima stavlja na raspolaganje milijune bojišnih snimki kako bi ubrzali razvoj autonomnih sustava protiv Rusije.
President Of Ukraine from Україна, CC0, via Wikimedia Commons

min čitanja

Više

Tehnologija

Brzi rast podatkovnih centara prijeti europskoj energetskoj mreži
Europski skok u umjetnoj inteligenciji otvara novu energetsku bitku: mogu li podatkovni centri rasti, a mreža ostati zelena?

min čitanja

Više

Tehnologija

Google Mapama stiže „Ask Maps”: razgovorni AI planira rute i vodi kroz 3D navigaciju
Razgovorni alat „Ask Maps” od danas korisnicima u SAD-u i Indiji nudi personalizirano planiranje ruta, dok Immersive Navigation donosi 3D prikaz kretanja u Google Kartama.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Moskovljani se vraćaju voki-tokijima dok vlasti guše mobilni internet
Nepojasnjeni prekidi mobilnog interneta u Moskvi i St. Petersburgu prisilili su građane da komuniciraju voki-tokijima, dok vlasti guraju državnu „super-aplikaciju” Max.

min čitanja

Više

Tehnologija

Riječki umjetnik Andrej Zbašnik predstavio dijaloški eksperiment s umjetnom inteligencijom
U Galeriji OK predstavljena je knjiga „Dijalozi o životu i umjetnosti“, nastala u dijalogu riječkog umjetnika Andreja Zbašnika i umjetne inteligencije ChatGPT.

min čitanja

Više

Najčitanije

Politika

Plenković o srbijanskoj hipersoničnoj raketi „Zagrepčanka“: Hrvatska će alarmirati NATO
Premijer u Požegi najavio razgovore s NATO-om o srbijanskom oružju i mogućnost zamrzavanja cijena struje i plina.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Biznis

Iva Radić odstupila s čela Journal Media: prijavila sumnje u izvlačenje novca
Osnivačica portala Journal.hr podnijela je ostavku na mjesto direktorice zbog sumnji u višegodišnje nezakonite radnje nad financijama tvrtke, dok je poslovanje portala privremeno zaustavljeno.

min čitanja

Više

Najnovije

Sport

UEFA otvorila istragu protiv Pedra Neta zbog guranja sakupljača lopti

Biznis

Nova EPBD direktiva mijenja pravila igre na hrvatskom tržištu nekretnina

Politika

Strah od širenja rata: Europa se priprema na mogući udar iz Irana

Tehnologija

Prvi AI plivački mlaz lansiran na Kickstarteru

Sport

Mišo Krstičević se vratio kući: preuzeo Jadran Luka Ploče i odmah najavio pohod na vrh

Lifestyle

Festival grintanja opet puni Split: tri teme koje uvijek raspale Dalmatince

Politika

Porast intervencija i gospodarskog kriminala, manje nasilnih djela: PGŽ usvojila izvješće o civilnoj zaštiti

Sport

Meksiko ostao bez prvog vratara uoči Svjetskog prvenstva

Vijesti

Napadač ubijen ispred sinagoge u Michiganu

Politika

Malić i Josipović u facebook dvoboju metaforama

Biznis

Iza buke protiv investicija krije se problem strukture stranog kapitala