Zatražite oglasni prostor

Učitavam...

Zatražite oglasni prostor

Učitavam...

Politika privatnosti

Zatražite oglasni prostor

Učitavam...

Tehnologija

12. ožujka 2026, 14:30

Platforma InferenceSense pretvara mrtvo vrijeme GPU-ova u prihod

Startup FriendliAI lansirao je InferenceSense, sustav koji automatski preusmjerava neiskorištene GPU-ove na plaćene AI inferencije i prihod dijeli s operaterom.

min. čitanja

GPU klasteri često provode sate u praznom hodu – treninzi završe, radna opterećenja se preusmjere, a skupi strojevi nastavljaju trošiti struju i hlađenje bez ikakvog povrata. Korejski startup FriendliAI tvrdi da je pronašao način kako to „mrtvo vrijeme” pretvoriti u novac.

Osnivač Byung-Gon Chun, bivši profesor sa Sveučilišta u Seulu i autor znanstvenog rada koji je uveo kontinuirano grupiranje zahtjeva (core mehanizam u danas raširenom vLLM-u), ovoga tjedna lansira platformu InferenceSense. Ideja je jednostavna: kada god GPU-ovi ostanu bez primarnog posla, InferenceSense automatski pokreće plaćene inferencijske zadatke na otvorenim velikim jezičnim modelima poput DeepSeeka, Qwena, Kimi, GLM-a ili MiniMaxa, a prihod od obrađenih tokena dijeli s vlasnikom hardvera.

„Umjesto da GPU-ovi besposličare, izvođenjem inferencija mogu se unovčiti”, ističe Chun. Čim interni raspoređivač zatraži natrag karticu, InferenceSense u nekoliko sekundi prekida svoj posao i vraća je primarnom sustavu.

Platforma sjeda na postojeći Kubernetes, pa operator samo označi koje će se kartice i pod kojim uvjetima ponuditi. FriendliAI potom preuzima sve ostalo: dovodi klijente, optimizira modele, brine se o posluživanju i nudi nadzornu ploču uživo s prikazom zarade i opterećenja.

Ključ zarade leži u broju tokena obrađenih po GPU-satu. FriendliAI tvrdi da njihov potpuno C++-om pisan motor s vlastitim GPU jezgrama postiže dvostruko do trostruko veći protok od „golog” vLLM-a – zahvaljujući internim rješenjima za spekulativno dekodiranje, kvantizaciju i upravljanje KV-predmemorijom. Više tokena znači i veći prihod u istom vremenu.

Za razliku od tržišta spot GPU-ova, gdje provajder iznajmljuje cijelu karticu trećoj strani, ovdje operator zadržava potpunu kontrolu: monetizira samo one minute kada mu hardver stvarno miruje. Time dobiva dodatni motiv da stalno drži konkurentne cijene tokena, što bi s vremenom moglo pritisnuti troškove inferencije širom industrije.

„Kad dobavimo učinkovitije dobavljače, ukupni trošak pada. InferenceSense tome može pridonijeti”, zaključuje Chun.

#kubernetes #friendliai #inferencesense #byung-gon-chun #sveuciliste-u-seulu

Zatražite oglasni prostor

Učitavam...

Zatražite oglasni prostor

Učitavam...

Komentari ~ 0

0/1000 znakova

Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja

Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”

Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej

Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku

Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru

Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija

UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva

Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi

Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete

Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Tehnologija

Kibernetički napad oborio Canvas i poremetio nastavu tisućama škola

Masovni pad platforme Canvas zbog napada grupe "ShinyHunters" poremetio je nastavu diljem SAD-a, a hakeri prijete objavom podataka više od 8 800 škola.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja

Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana

KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Vijesti

Rovinj obilježio Dan pobjede nad nacifašizmom i Dan Europe

Grad na Valdibori polaganjem vijenca i prigodnim programom podsjetio na važnost slobode, mira i zajedništva.

min čitanja

Više

Zatražite oglasni prostor

Učitavam...

Najnovije

Sport

Mali olimpijci preplavili Zelinu i pokazali sportski duh

Vijesti

Vinkovci na sajmu EU projekata pokazali kako fondovi mijenjaju lice grada

Politika

Sokol uzvraća Plenkoviću: „Unutarstranački nesporazumi trebaju ostati unutra, ali HDZ mora biti snažan”

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja

Sport

Vekić s ekspresnom pobjedom u polufinalu Istanbula

Biznis

Državne nekretnine otvaraju vrata poslovnim prostorima u sedam gradova

Lifestyle

Hrvatske majke sve starije i obrazovanije, a djece sve manje

Sport

Ulaznice za derbi Dinamo – Hajduk gotovo planule, Maksimir sprema vatrenu atmosferu

Vijesti

Sindikat biciklista: pet godina obećanja, a zagrebačke ulice i dalje neprijateljske za bicikle

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”

Vijesti

„Knjiga od srca“ u Senju osigurala pakete pomoći najsiromašnijima