CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

12. veljače 2026, 16:21

Nvidia Blackwell dramatično reže troškove AI inferencija

Analiza četiriju tvrtki pokazuje da kombinacija Nvidijina Blackwella, optimiziranog softvera i otvorenih modela snižava cijenu AI inferencije i do deset puta.

min. čitanja

XFacebookWhatsApp

Nova analiza Nvidije pokazuje kako su četiri vodeća pružatelja inferencijskih usluga – Baseten, DeepInfra, Fireworks AI i Together AI – snizila cijenu po tokenu između četiri i deset puta prelaskom na Blackwell platformu, optimizirane softverske stogove i otvoren-izvorske modele koji dosežu tzv. frontier razinu inteligencije.

Prema podacima iz produkcijskih okruženja:

• Sully.ai je u zdravstvu spustio troškove inferencije za 90 % te ubrzao odgovore za 65 %. Automatizacijom medicinskog kodiranja i bilješki tvrtka je liječnicima „vratila” više od 30 milijuna minuta rada.

• Latitude je za svoju igru AI Dungeon na DeepInfra-ovoj Blackwell infrastrukturi smanjio trošak s 20 na 5 centi po milijunu tokena. Sam prelazak s Hopper na Blackwell donio je dvostruko smanjenje, a dodatni prelazak na niskoprecizni format NVFP4 još dvostruko – ukupno četiri puta jeftinije.

• Sentient Foundation je, na Fireworks AI-jevom optimiziranom stogu, snizio cijenu obrade složenih višestrukih chat-agenata za 25–50 %, pri čemu je u jednom tjednu obradio 5,6 milijuna upita uz nisku latenciju.

• Decagon je za glasovnu korisničku podršku na Together AI-jevoj infrastrukturi postigao šest puta niži trošak po upitu, zadržavši vrijeme odziva ispod 400 ms – ključno kako bi korisnici ostali na liniji.

Izvještaj naglašava da hardverski skok sam po sebi donosi približno dvostruko smanjenje troškova, no veći učinci dolaze tek kad se doda optimizirani softver i prelazak na NVFP4 ili slične niskoprecizne formate te na otvorene modele, koji uklanjaju licence s visokim maržama.

„Performance is what drives down the cost of inference”, ističe Dion Harris, viši direktor za HPC i AI hiperskalerska rješenja u Nvidiji, objašnjavajući da se veća propusnost izravno prevodi u manje dolara po tokenu.

Paradoksalno, zaključuje se u analizi, za jeftiniju inferenciju potrebno je ulagati u snažniju infrastrukturu: kroz veću brzinu obrade i precizno podešene modele poduzeća mogu proširiti AI rješenja s pilot-projekata na milijune krajnjih korisnika, a da pritom trošak ostane održiv.

#nvidia#baseten#deepinfra#fireworks-ai#dion-harris
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Havaji asfaltiraju ceste plastičnim otpadom iz oceana
Havaji pokrenuli projekt recikliranja plastičnog otpada iz oceana u asfalt za lokalne ceste, prvi takve vrste na svijetu.

min čitanja

Više

Tehnologija

Građani u obrani Jadrana: u Splitu predstavljene aplikacije koje svakome otvaraju vrata znanosti
Citizen Science Day u Splitu okupio je pedesetak sudionika i predstavio niz aplikacija koje građanima omogućuju aktivno sudjelovanje u praćenju i zaštiti Jadrana.

min čitanja

Više

Tehnologija

OpenAI lansirao GPT-5.4-Cyber nakon upozorenja konkurenta
Nakon što je Anthropic odlučio zadržati svoj novi AI model pod ključem zbog straha od zlouporabe, OpenAI predstavlja GPT-5.4-Cyber, alat namijenjen kibernetičkim stručnjacima.

min čitanja

Više

Tehnologija

Poljičica prelazi u digitalno doba
U Srinjinama se 17. travnja predstavlja digitalni font Poljičice, staroga pisma proglašenog nematerijalnim kulturnim dobrom 2023. godine.

min čitanja

Više

Tehnologija

Anthropic i OpenAI u klinču zbog kontroverznog prijedloga zakona o odgovornosti AI-a u Illinoisu
Tvrtke su se razišle oko SB 3444, koji bi laboratorije oslobodio odgovornosti za masovne štete izazvane umjetnom inteligencijom.

min čitanja

Više

Tehnologija

Iva Tolić: Stanice nas uče da je obnova srž života
Hrvatska znanstvenica Iva Tolić objašnjava kako neprekidna obnova na staničnoj razini može biti nadahnuće za suočavanje s globalnim krizama.

min čitanja

Više

Tehnologija

Prvi riječki bankomat zaškripio zbog prašine, ali najavio novu eru plaćanja
Podsjetnik na 1986.: riječki bankomat pokvarila je obična prašina, ali je unatoč tome označio početak digitalnog upravljanja novcem.

min čitanja

Više

Tehnologija

NASA-ino superračunalo: sav život na Zemlji nestaje za milijardu godina
Superračunalo NASA-e, analizirajući 400 000 scenarija, prognozira da će širenje Sunca uništiti sav život na Zemlji za otprilike milijardu godina.

min čitanja

Više

Tehnologija

Projektni dan u Splitu otkrio snagu mladih inovatora
Učenici Splitsko-dalmatinske županije na Projektnom danu Centra izvrsnosti predstavili su inovativne projekte, a najavljene su i nove prijave te velike investicije u školsku infrastrukturu.

min čitanja

Više

Tehnologija

Rijeka 28. travnja postaje središte razgovora o kibernetičkoj sigurnosti
Interaktivna izložba na Korzu i praktična radionica u Proizvodnom parku Torpedo približit će suvremene prijetnje i rješenja kibernetičke zaštite građanima i malim poduzetnicima.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Lifestyle

„Nebo” Kristine Kinkela Valčić stiže u Artsadu

Vijesti

Vozač stranih tablica vozio u krivom smjeru kod Koteksa, građanin spriječio nesreću

Vijesti

Policija razotkrila lanac pustošenja šuma kod Omiša

Lifestyle

Labin priprema „Malu placu zdravlja” za najmlađe

Lifestyle

Senjski planinari osvojili Kamenjak, najviši vrh Raba

Vijesti

Spaljivanje otpada izmaklo nadzoru: 47-godišnjak izazvao šumski požar u Dubravicama

Vijesti

Hitna sanacija ostavila dio Puntižele i Galižane bez vode

Biznis

Željko Mihelić preuzeo čelo HPK-a uz upozorenje na loše brojke hrvatske poljoprivrede

Tehnologija

Havaji asfaltiraju ceste plastičnim otpadom iz oceana

Lifestyle

Vatrogasac i pjesnik Mate Pavić predstavio novu zbirku stihova u Rijeci

Lifestyle

Opatijska knjižnica u travnju slavi knjigu: dječji tjedan, noć čitanja i šetnja Gervaisovim stihovima