CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

15. rujna 2025, 20:27

Eksplozija „razumskih” tokena gura troškove AI-a u crveno

Glavni AI direktor WEKA-e upozorava da su stvarni troškovi inferencije negativni: potražnja za tokenima raste 10 000 puta brže od pada njihove cijene.

min. čitanja

Najnoviji modeli umjetne inteligencije sve se češće spotiču o vrlo prizemne prepreke: energetska ograničenja, latentnost inferencije i sve veće troškove po pojedinom tokenu. Premda su se nominalni troškovi inferencije u posljednje dvije godine strmoglavili „gotovo tisućustruko”, stvarna slika je puno sumornija, upozorio je Val Bercovici, glavni direktor za umjetnu inteligenciju u tvrtki WEKA.

„Kad se pogleda neto jedinični trošak, on je trenutačno negativan. Vratili smo se u klasičnu Uberovu igru u kojoj investitori subvencioniraju stvarnu cijenu proizvoda”, kazao je Bercovici.

Razumski tokeni i rojenje agenata

Prekretnica se dogodila krajem prošle godine kada je OpenAI javno predstavio koncepciju „razumskog” modela. Uslijedio je skok potražnje: prema riječima Bercovicija, broj tokena koje ti modeli generiraju porastao je „za dva reda veličine” u odnosu na prethodnu generaciju pretreniranja.

Ove je godine dodatni zamah donio uspon tzv. agentske umjetne inteligencije. Poslovna vrijednost AI-agenata pokazala se opipljivom, ali cijena je nova „eksplozija“ tokena – još deset puta veća nego prije. „Čak i ako je cijena inferencije optimistično pala tisuću puta, potražnja za tokenima skočila je najmanje 10 000 puta”, istaknuo je Bercovici. „Govorimo o razlici od čitavog reda veličine.”

Od skaliranja podataka do skaliranja rezoniranja

Alati poput Claude Codea ili Cursor-a već sada podižu produktivnost programera za više od 30 %. „Vidim kako se ljestvica seli s računanja i podataka u fazi pretreniranja na rezoniranje u vremenu izvođenja, a zatim na agente – to su nove skale rasta”, rekao je Bercovici. „Kad to sve zbrojimo, AGI više ne izgleda kao daleki san.”

No da bi se ti prinosi doista materijalizirali, valja temeljito preispitati razvojne procese. Za razliku od ljudi, koji kod segmentiraju u funkcije i datoteke, agentske se skupine najbolje snalaze ako sav izvorni kod stoji u jednoj golemoj datoteci kako bi imale potpun kontekst. „Kontekst je sve”, naglasio je Bercovici. „Ako ne možete priuštiti toliku količinu tokena, nećete moći napraviti ništa.”

Preispitivanje osnovnih načela infrastrukture

Jedan od recepata za smanjenje troškova je radikalna promjena infrastrukturnih pretpostavki. Primjerice, postojeći NVMe pogoni mogu se prenamijeniti da funkcioniraju poput DRAM-a. „Ako niskobudžetne, visokokapacitetne NVMe uređaje redeployate kao radnu memoriju i dobijete potrebnu propusnost u fazi inferencije, možete temeljito preokrenuti ekonomiku cijelog procesa”, objasnio je.

Tvornica bez proizvodne trake

U konačnici, učinkovitija arhitektura ne znači samo bržu obradu tokena, nego i uštede energije i novca koje čine AI profitabilnom. „Surova je realnost da današnje AI tvornice nemaju proizvodnu traku. Inferencija je nevjerojatno neučinkovita, što napuhuje cijenu tokena”, zaključio je Bercovici. „Oni koji prvi uvedu ‘traku’ i optimiziraju inferenciju mogli bi steći prednost koju konkurencija neće moći stići.”

#openai#claude-code#cursor#val-bercovici#weka

Slično

Tehnologija

OpenAI predstavio GPT-5-Codex za autonomno pisanje i recenziju koda
Novi model prilagođen je autonomnom kodiranju, dubinskoj recenziji i višesatnim refaktorima, a dostupan je kroz CLI, IDE proširenje i oblak.

min čitanja

Više

Tehnologija

OpenAI ubrzava razvoj humanoidnih robota u potrazi za AGI-jem
OpenAI agresivno zapošljava stručnjake za humanoidnu robotiku i gradi tim koji bi trebao spojiti napredne AI modele s robotskim tijelima u potrazi za općom umjetnom inteligencijom.

min čitanja

Više

Tehnologija

Digitalni iskorak za 12 000 obrtnika u Primorsko-goranskoj županiji
Obrtnička komora PGŽ-a i tvrtka Terminalni Poslovi lansirali su DigiArhivu, rješenje koje obrtnicima omogućuje jednostavno upravljanje e-računima i potpunu digitalizaciju dokumentacije.

min čitanja

Više

Tehnologija

Masovna otpuštanja stručnjaka za Googleovu umjetnu inteligenciju potaknula borbu za radnička prava
Više od 200 visokokvalificiranih vanjskih suradnika ostalo je bez posla usred pokušaja organiziranja i zahtjeva za boljim uvjetima rada.

min čitanja

Više

Tehnologija

Hakeri provalili u Kerinške sustave: iz Gucci, Balenciage i McQueena ukradeni osobni podaci kupaca
Shiny Hunters ukrali su imena, kontakte i datume rođenja kupaca luksuznih brendova, dok Kering tvrdi da financijski podaci nisu kompromitirani.

min čitanja

Više

Tehnologija

Bruxelles upozorava: bez jedinstvene vizije istraživačke centre gubimo znanstveni primat
Europska komisija traži čvršću koordinaciju ulaganja u istraživačku infrastrukturu kako bi Unija ostala privlačna vrhunskim znanstvenicima.

min čitanja

Više

Tehnologija

Washington i Peking dogovorili prijenos vlasništva nad TikTokom
Američki i kineski pregovarači postigli su okvirni sporazum kojim bi TikTok prešao u američke ruke, čime bi se nakon godina prijepora uklonile sigurnosne sumnje Washingtona.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524By Adam Schultz - https://www.whitehouse.gov/administration/president-biden/ (archive), Public Domain, https://commons.wikimedia.org/w/index.php?curid=161242193

min čitanja

Više

Tehnologija

Državni NIAS uskoro dostupan poduzetnicima
Ministarstvo pravosuđa, uprave i digitalne transformacije širi državni identifikacijski sustav NIAS na tvrtke i udruge, a veće novosti u aplikaciji mGrađani stižu 2026.

min čitanja

Više

Tehnologija

Filmaktiv otvara radionicu video mapiranja u Rijeci
Četverodnevni tečaj od 18. do 21. rujna 2025. u Rijeci polaznike uvodi u kreativnu tehniku pretvaranja urbanih površina u vizualna platna.

min čitanja

Više

Tehnologija

Genomsko testiranje embrija najavljuje revoluciju trudnoće, tvrdi osnivačica Orchid
Pregled tvrdnji o sve dostupnijem sekvenciranju embrija, obećanju smanjenja genetskih bolesti i etičkim dilemama koje prate novu tehnologiju.

min čitanja

Više

Najčitanije

Politika

Dron iznad sjedišta poljske Vlade; uhićena dvojica Bjelorusa
SOP je iznad zgrada poljske Vlade oborio dron i priveo dvojicu bjeloruskih državljana; incident dolazi nakon niza ruskih upada dronovima i pokretanja NATO-ove operacije „Istočna straža“.
Autor European People's Party - EPP Summit, 24 March 2022, Brussels, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=138912279

min čitanja

Više

Nogomet

Svjetski prvak Samuel Umtiti u 31. godini objavio kraj karijere
Francuski stoper kamerunskih korijena, junak polufinala Svjetskog prvenstva 2018., zbog kroničnih ozljeda završio karijeru mnogo ranije nego što se očekivalo.

min čitanja

Više

Politika

Dodik i Čović u novom verbalnom okršaju oko upražnjenih funkcija
Dodik odbacuje Čovićevu tvrdnju da je Republika Srpska bez predsjednika pa uzvraća idejom o izboru „predsjednika Herceg-Bosne”.
© European Union, 2025, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Politika

Turudić pred Saborom: „Pravda mora biti brza, inače postaje nepravda“
Odbor za ljudska prava prihvatio je izvješće glavnog državnog odvjetnika Ivana Turudića, koji ističe skraćivanje postupaka, pad broja neriješenih predmeta i potrebu brže pravde.
Autor Kepkke. - Моја особна архива. Kepkke., Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=15184061

min čitanja

Više

Atletika

Diskvalifikacija olimpijskog pobjednika Hockera zbog guranja u Tokiju
Olimpijski prvak na 1.500 metara izbačen je iz finala Svjetskog prvenstva zbog guranja njemačkog rivala u polufinalu u Tokiju.

min čitanja

Više

Najnovije

Politika

DNK dokazi povezuju osumnjičenika s ubojstvom Charlieja Kirka, tvrdi FBI

Biznis

Riječki poslodavci i gradonačelnica dogovorili mjere za nova radna mjesta

Sport

Borussia Mönchengladbach otpustila Gerarda Seoanea nakon niza od 10 utakmica bez pobjede

Tehnologija

Digitalni iskorak za 12 000 obrtnika u Primorsko-goranskoj županiji

Politika

Vlada u utorak usvaja novi energetski paket vrijedan 175 milijuna eura

Politika

Britanski Typhoone u nekoliko dana nad Poljskom: NATO spreman obarati ruske dronove

Lifestyle

Roman o bolnoj ispovijesti pretvoren u kazalište: „Matija” stiže na daske Arterarija

Vijesti

Belgijski sud pod jakim osiguranjem: počelo suđenje navodnom kralju krijumčarenja kokaina

Vijesti

Vukovar se prisjetio stradanja Sajmišta: 34 godine od najkrvavijih borbi

Sport

Mladost s pojačanjima i starim trenerom kreće po Ligu prvaka

Vijesti

Prvih 48 odgojiteljica diplomiralo na slatinskom dislociranom studiju