CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

15. rujna 2025, 20:27

Eksplozija „razumskih” tokena gura troškove AI-a u crveno

Glavni AI direktor WEKA-e upozorava da su stvarni troškovi inferencije negativni: potražnja za tokenima raste 10 000 puta brže od pada njihove cijene.

min. čitanja

XFacebookWhatsApp

Najnoviji modeli umjetne inteligencije sve se češće spotiču o vrlo prizemne prepreke: energetska ograničenja, latentnost inferencije i sve veće troškove po pojedinom tokenu. Premda su se nominalni troškovi inferencije u posljednje dvije godine strmoglavili „gotovo tisućustruko”, stvarna slika je puno sumornija, upozorio je Val Bercovici, glavni direktor za umjetnu inteligenciju u tvrtki WEKA.

„Kad se pogleda neto jedinični trošak, on je trenutačno negativan. Vratili smo se u klasičnu Uberovu igru u kojoj investitori subvencioniraju stvarnu cijenu proizvoda”, kazao je Bercovici.

Razumski tokeni i rojenje agenata

Prekretnica se dogodila krajem prošle godine kada je OpenAI javno predstavio koncepciju „razumskog” modela. Uslijedio je skok potražnje: prema riječima Bercovicija, broj tokena koje ti modeli generiraju porastao je „za dva reda veličine” u odnosu na prethodnu generaciju pretreniranja.

Ove je godine dodatni zamah donio uspon tzv. agentske umjetne inteligencije. Poslovna vrijednost AI-agenata pokazala se opipljivom, ali cijena je nova „eksplozija“ tokena – još deset puta veća nego prije. „Čak i ako je cijena inferencije optimistično pala tisuću puta, potražnja za tokenima skočila je najmanje 10 000 puta”, istaknuo je Bercovici. „Govorimo o razlici od čitavog reda veličine.”

Od skaliranja podataka do skaliranja rezoniranja

Alati poput Claude Codea ili Cursor-a već sada podižu produktivnost programera za više od 30 %. „Vidim kako se ljestvica seli s računanja i podataka u fazi pretreniranja na rezoniranje u vremenu izvođenja, a zatim na agente – to su nove skale rasta”, rekao je Bercovici. „Kad to sve zbrojimo, AGI više ne izgleda kao daleki san.”

No da bi se ti prinosi doista materijalizirali, valja temeljito preispitati razvojne procese. Za razliku od ljudi, koji kod segmentiraju u funkcije i datoteke, agentske se skupine najbolje snalaze ako sav izvorni kod stoji u jednoj golemoj datoteci kako bi imale potpun kontekst. „Kontekst je sve”, naglasio je Bercovici. „Ako ne možete priuštiti toliku količinu tokena, nećete moći napraviti ništa.”

Preispitivanje osnovnih načela infrastrukture

Jedan od recepata za smanjenje troškova je radikalna promjena infrastrukturnih pretpostavki. Primjerice, postojeći NVMe pogoni mogu se prenamijeniti da funkcioniraju poput DRAM-a. „Ako niskobudžetne, visokokapacitetne NVMe uređaje redeployate kao radnu memoriju i dobijete potrebnu propusnost u fazi inferencije, možete temeljito preokrenuti ekonomiku cijelog procesa”, objasnio je.

Tvornica bez proizvodne trake

U konačnici, učinkovitija arhitektura ne znači samo bržu obradu tokena, nego i uštede energije i novca koje čine AI profitabilnom. „Surova je realnost da današnje AI tvornice nemaju proizvodnu traku. Inferencija je nevjerojatno neučinkovita, što napuhuje cijenu tokena”, zaključio je Bercovici. „Oni koji prvi uvedu ‘traku’ i optimiziraju inferenciju mogli bi steći prednost koju konkurencija neće moći stići.”

#openai#claude-code#cursor#val-bercovici#weka

Slično

Tehnologija

Kineski DeepSeek otvorio novu frontu u AI utrci s GPT-om i Geminijem
DeepSeek je objavio open-source modele koji po rezultatima i cijeni izvedbe izazivaju GPT-5 i Gemini-3.0-Pro, unatoč političkim pritiscima i ograničenjima čipova.

min čitanja

Više

Tehnologija

AWS i Visa udružuju snage za brži razvoj agentične trgovine
AWS donosi Visa Intelligence Commerce na svoj Marketplace i najavljuje otvorene nacrte za izgradnju AI agenata koji samostalno obavljaju kupnju i plaćanja.

min čitanja

Više

Tehnologija

Trka za općom umjetnom inteligencijom dostiže ludilo: milijuni kodera, trilijuni dolara i ‘screameri’ koji urlaju
Silicijska dolina i Kina ulažu goleme iznose u razvoj AGI-ja. Dok mladi inženjeri rade bez predaha, superračunala troše energiju malih gradova, a stručnjaci upozoravaju na rizike – od cybernapada do poticanja samoubojstava.
TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Startup OpenAGI tvrdi da je nadmašio OpenAI: novi model Lux upravlja računalom s 83,6 % uspjeha
Startup iz San Francisca tvrdi da njegov model Lux autonomno upravlja računalom preciznije i jeftinije od konkurencije OpenAI-ja i Anthropica, a suradnja s Intelom trebala bi ga dovesti i na lokalne uređaje.

min čitanja

Više

Tehnologija

Jedan upit blokiran, deset prolazi: višekratni napadi ruše sigurnost otvorenih AI modela
Ciscoovo istraživanje otkriva da upornost napadača dramatično povećava uspjeh „jailbreak” napada na otvorene AI modele, sa 13 % na čak 92 %, te poziva poduzeća na jače zaštitne mjere.

min čitanja

Više

Tehnologija

Apptio spaja financije i IT: jedinstveni pogled na troškove ubrzava odluke
Apptio predstavlja rješenje koje ujedinjuje financijske, operativne i poslovne podatke, omogućujući brže i točnije odluke o tehnološkim ulaganjima u doba eksplozije AI-a i clouda.

min čitanja

Više

Tehnologija

Pet velikih prekretnica: znanstvenici mapirali kako se mozak mijenja od djetinjstva do duboke starosti
Istraživači sa Sveučilišta Cambridge otkrili su da se ljudski mozak radikalno preoblikuje pet puta, s ključnim prekretnicama u dobi od 9, 32, 66 i 83 godine.

min čitanja

Više

Tehnologija

Američki startup Arcee AI lansirao Trinity Mini i Nano, najavio gigantski model za 2026.
Trinity obitelj donosi otvorene modele trenirane isključivo u SAD-u; najveći, Trinity Large, stiže početkom 2026.

min čitanja

Više

Tehnologija

Osijek uoči Green Matrix Summita: Slavonija pokazuje kako izgleda zelena i digitalna budućnost
Treće izdanje Green Matrix Summita 4. i 5. prosinca u Osijeku okuplja više od pedeset stručnjaka kako bi ubrzali zelenu i digitalnu tranziciju gospodarstva Slavonije.

min čitanja

Više

Tehnologija

Američka tvrtka Flock snimke iz nadzornih kamera šalje na obradu radnicima u inozemstvu
Otkrivene upute i popisi radnika pokazuju da Flock nadzorne snimke iz SAD-a označava radnicima na Filipinima, što potiče nova pitanja o privatnosti i nadzoru.

min čitanja

Više

Najčitanije

Vijesti

Plava vrpca Vjesnika okupila heroje mora: od Omiša do Premude
Svečanost u Opatiji okupila hrabre spasitelje; glavna priznanja dobili Omišanin Mario Popovac, mještani Premude i crnogorska mornarica, dok je posebno priznanje pripalo profesoru Alenu Jugoviću.

min čitanja

Više

Politika

Tisuće na ulicama Sofije zbog skorog uvođenja eura: prosvjedi prerasli u sukobe s policijom
Demonstranti u bugarskoj prijestolnici napali su policiju kamenjem i pirotehnikom, prosvjedujući protiv proračuna i prelaska na euro 1. siječnja.
By European Parliament from EU - New ECB Chief Lagarde to address plenary for first time, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=96224562

min čitanja

Više

Nogomet

FIFA u subotu otkriva kompletan raspored SP-a 2026.
U Washingtonu se u petak održava ždrijeb skupina za SP 2026., a dan kasnije FIFA uživo otkriva detaljan raspored svih 104 utakmice.

min čitanja

Više

Biznis

Bruxelles odobrio sedmi hrvatski zahtjev: stiže još 1,1 milijarda eura za reforme i ulaganja
Europska komisija potvrdila je da je Hrvatska ispunila svih 22 etape i 31 cilj za sedmu tranšu sredstava iz Nacionalnog plana oporavka i otpornosti, vrijednu 1,1 milijardu eura.

min čitanja

Više

Nogomet

Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542

Dinamo uz golmana manje slomio Goricu i zasjeo na vrh HNL-a
Monsef Bakrar i Marko Soldo presudili Gorici, a Dinamo je s igračem manje obranio vodstvo i preuzeo vrh prvenstvene ljestvice.

min čitanja

Više

Najnovije

Politika

Nizozemski kralj u Surinamu: „Nećemo bježati od pitanja ropstva”

Politika

Broj zaposlenih osoba s invaliditetom u tri godine udvostručen, slijede nove potpore poslodavcima

Vijesti

Stručnjaci upozoravaju na uspon „prevarantskih država” u jugoistočnoj Aziji

Tehnologija

Jedan upit blokiran, deset prolazi: višekratni napadi ruše sigurnost otvorenih AI modela

Vijesti

Francuski srebrnjaci iz križarskog doba otkriveni u Baranji blistaju u Osijeku

Vijesti

E-mailovi upozoravali na psihički slom osumnjičenog za pucnjavu na pripadnike Nacionalne garde

Vijesti

Portreti obrane: Osječki veterani pokrenuli potragu za imenima 3.000 pripadnika 106. brigade

Sport

Modrić se prisjetio dolaska u Real: „Cristiano je rekao – napokon si došao”

Vijesti

Pijan sletio s ceste kod Ražina i prevrnuo automobil

Vijesti

WHO uvjetno preporučio GLP-1 lijekove za liječenje pretilosti

Vijesti

Katalonske školjke otkrivaju zvuk star 6 000 godina