CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

12. ožujka 2026, 14:30

Platforma InferenceSense pretvara mrtvo vrijeme GPU-ova u prihod

Startup FriendliAI lansirao je InferenceSense, sustav koji automatski preusmjerava neiskorištene GPU-ove na plaćene AI inferencije i prihod dijeli s operaterom.

min. čitanja

XFacebookWhatsApp

GPU klasteri često provode sate u praznom hodu – treninzi završe, radna opterećenja se preusmjere, a skupi strojevi nastavljaju trošiti struju i hlađenje bez ikakvog povrata. Korejski startup FriendliAI tvrdi da je pronašao način kako to „mrtvo vrijeme” pretvoriti u novac.

Osnivač Byung-Gon Chun, bivši profesor sa Sveučilišta u Seulu i autor znanstvenog rada koji je uveo kontinuirano grupiranje zahtjeva (core mehanizam u danas raširenom vLLM-u), ovoga tjedna lansira platformu InferenceSense. Ideja je jednostavna: kada god GPU-ovi ostanu bez primarnog posla, InferenceSense automatski pokreće plaćene inferencijske zadatke na otvorenim velikim jezičnim modelima poput DeepSeeka, Qwena, Kimi, GLM-a ili MiniMaxa, a prihod od obrađenih tokena dijeli s vlasnikom hardvera.

„Umjesto da GPU-ovi besposličare, izvođenjem inferencija mogu se unovčiti”, ističe Chun. Čim interni raspoređivač zatraži natrag karticu, InferenceSense u nekoliko sekundi prekida svoj posao i vraća je primarnom sustavu.

Platforma sjeda na postojeći Kubernetes, pa operator samo označi koje će se kartice i pod kojim uvjetima ponuditi. FriendliAI potom preuzima sve ostalo: dovodi klijente, optimizira modele, brine se o posluživanju i nudi nadzornu ploču uživo s prikazom zarade i opterećenja.

Ključ zarade leži u broju tokena obrađenih po GPU-satu. FriendliAI tvrdi da njihov potpuno C++-om pisan motor s vlastitim GPU jezgrama postiže dvostruko do trostruko veći protok od „golog” vLLM-a – zahvaljujući internim rješenjima za spekulativno dekodiranje, kvantizaciju i upravljanje KV-predmemorijom. Više tokena znači i veći prihod u istom vremenu.

Za razliku od tržišta spot GPU-ova, gdje provajder iznajmljuje cijelu karticu trećoj strani, ovdje operator zadržava potpunu kontrolu: monetizira samo one minute kada mu hardver stvarno miruje. Time dobiva dodatni motiv da stalno drži konkurentne cijene tokena, što bi s vremenom moglo pritisnuti troškove inferencije širom industrije.

„Kad dobavimo učinkovitije dobavljače, ukupni trošak pada. InferenceSense tome može pridonijeti”, zaključuje Chun.

#kubernetes#friendliai#inferencesense#byung-gon-chun#sveuciliste-u-seulu

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Ukrajina otvara bojišne podatke za treniranje savezničkih AI sustava
Ministar obrane Mihajlo Fedorov kaže da Kijev partnerima stavlja na raspolaganje milijune bojišnih snimki kako bi ubrzali razvoj autonomnih sustava protiv Rusije.
President Of Ukraine from Україна, CC0, via Wikimedia Commons

min čitanja

Više

Tehnologija

Brzi rast podatkovnih centara prijeti europskoj energetskoj mreži
Europski skok u umjetnoj inteligenciji otvara novu energetsku bitku: mogu li podatkovni centri rasti, a mreža ostati zelena?

min čitanja

Više

Tehnologija

Google Mapama stiže „Ask Maps”: razgovorni AI planira rute i vodi kroz 3D navigaciju
Razgovorni alat „Ask Maps” od danas korisnicima u SAD-u i Indiji nudi personalizirano planiranje ruta, dok Immersive Navigation donosi 3D prikaz kretanja u Google Kartama.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Moskovljani se vraćaju voki-tokijima dok vlasti guše mobilni internet
Nepojasnjeni prekidi mobilnog interneta u Moskvi i St. Petersburgu prisilili su građane da komuniciraju voki-tokijima, dok vlasti guraju državnu „super-aplikaciju” Max.

min čitanja

Više

Tehnologija

Riječki umjetnik Andrej Zbašnik predstavio dijaloški eksperiment s umjetnom inteligencijom
U Galeriji OK predstavljena je knjiga „Dijalozi o životu i umjetnosti“, nastala u dijalogu riječkog umjetnika Andreja Zbašnika i umjetne inteligencije ChatGPT.

min čitanja

Više

Tehnologija

Opatijska TZ nudi iznajmljivačima bržu prijavu gostiju kroz aplikaciju mVisitor
TZ Opatije predstavila aplikaciju mVisitor koja vlasnicima apartmana omogućuje brzu i besplatnu prijavu gostiju u sustav eVisitor.

min čitanja

Više

Tehnologija

Zagreb razvija prometni portal vrijedan tri milijuna eura
Digitalna platforma omogućit će Zagrepčanima praćenje prometa uživo, prijavu problema i pristup e-uslugama, dok će gradskim službama donijeti preciznije analize i planiranje.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Nvidia lansirala Nemotron 3 Super, hibridni AI od 120 milijardi parametara
Nvidia je predstavila Nemotron 3 Super, hibridni model od 120 milijardi parametara namijenjen jeftinijem pogonu višestrukih AI-agenata u poslovnim okruženjima.

min čitanja

Više

Tehnologija

Googleov tim razvija AI agente koji spontano surađuju bez tvrdokodiranih pravila
Paradigms of Intelligence pokazuje da treniranje AI agenata protiv raznovrsnih protivnika stvara fleksibilne, suradljive sustave prikladne za složene poslovne primjene.

min čitanja

Više

Tehnologija

Britanski regulator traži strože provjere dobi na društvenim mrežama
ICO od TikToka, Facebooka, Instagrama i drugih traži konkretne dokaze da sprječavaju pristup djeci mlađoj od 13 godina; samounos datuma rođenja više nije dovoljan.

min čitanja

Više

Najčitanije

Biznis

Iva Radić odstupila s čela Journal Media: prijavila sumnje u izvlačenje novca
Osnivačica portala Journal.hr podnijela je ostavku na mjesto direktorice zbog sumnji u višegodišnje nezakonite radnje nad financijama tvrtke, dok je poslovanje portala privremeno zaustavljeno.

min čitanja

Više

Najnovije

Vijesti

Slavonsko selo i senzorno igralište obogatili osječki Zoološki vrt

Vijesti

Splitski taksisti tuže grad: brzopotezna podjela 60 koncesija izazvala pobunu

Lifestyle

Reper Nered nakon 800 kilometara Caminom planira novo hodočašće

Lifestyle

Blues diva Kyla Brox večeras u Puli, dio prihoda za djecu

Vijesti

Vinkovci ugostili fra Ivicu Perića: „Hrvatsko srce školuje tisuće djece u Africi”

Sport

Halilhodžić preuzeo Nantes: „Dugujem mu, ovo mi je posljednji posao”

Politika

Varšava uvodi zabranu noćne prodaje alkohola

Sport

Strukan sudi Dinamu, Pavlešić derbi na Poljudu

Biznis

Churchilla i Austena mijenjaju vidre i ježevi na novim britanskim novčanicama

Lifestyle

Plavi ožujak poziva na pregled: akcija protiv raka debelog crijeva u 13 gradova

Vijesti

Kutleša o naslijeđu kardinala Kuharića: „Ako budemo narod savjesti, bit ćemo narod nade”