CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

15. rujna 2025, 20:27

Eksplozija „razumskih” tokena gura troškove AI-a u crveno

Glavni AI direktor WEKA-e upozorava da su stvarni troškovi inferencije negativni: potražnja za tokenima raste 10 000 puta brže od pada njihove cijene.

min. čitanja

XFacebookWhatsApp

Najnoviji modeli umjetne inteligencije sve se češće spotiču o vrlo prizemne prepreke: energetska ograničenja, latentnost inferencije i sve veće troškove po pojedinom tokenu. Premda su se nominalni troškovi inferencije u posljednje dvije godine strmoglavili „gotovo tisućustruko”, stvarna slika je puno sumornija, upozorio je Val Bercovici, glavni direktor za umjetnu inteligenciju u tvrtki WEKA.

„Kad se pogleda neto jedinični trošak, on je trenutačno negativan. Vratili smo se u klasičnu Uberovu igru u kojoj investitori subvencioniraju stvarnu cijenu proizvoda”, kazao je Bercovici.

Razumski tokeni i rojenje agenata

Prekretnica se dogodila krajem prošle godine kada je OpenAI javno predstavio koncepciju „razumskog” modela. Uslijedio je skok potražnje: prema riječima Bercovicija, broj tokena koje ti modeli generiraju porastao je „za dva reda veličine” u odnosu na prethodnu generaciju pretreniranja.

Ove je godine dodatni zamah donio uspon tzv. agentske umjetne inteligencije. Poslovna vrijednost AI-agenata pokazala se opipljivom, ali cijena je nova „eksplozija“ tokena – još deset puta veća nego prije. „Čak i ako je cijena inferencije optimistično pala tisuću puta, potražnja za tokenima skočila je najmanje 10 000 puta”, istaknuo je Bercovici. „Govorimo o razlici od čitavog reda veličine.”

Od skaliranja podataka do skaliranja rezoniranja

Alati poput Claude Codea ili Cursor-a već sada podižu produktivnost programera za više od 30 %. „Vidim kako se ljestvica seli s računanja i podataka u fazi pretreniranja na rezoniranje u vremenu izvođenja, a zatim na agente – to su nove skale rasta”, rekao je Bercovici. „Kad to sve zbrojimo, AGI više ne izgleda kao daleki san.”

No da bi se ti prinosi doista materijalizirali, valja temeljito preispitati razvojne procese. Za razliku od ljudi, koji kod segmentiraju u funkcije i datoteke, agentske se skupine najbolje snalaze ako sav izvorni kod stoji u jednoj golemoj datoteci kako bi imale potpun kontekst. „Kontekst je sve”, naglasio je Bercovici. „Ako ne možete priuštiti toliku količinu tokena, nećete moći napraviti ništa.”

Preispitivanje osnovnih načela infrastrukture

Jedan od recepata za smanjenje troškova je radikalna promjena infrastrukturnih pretpostavki. Primjerice, postojeći NVMe pogoni mogu se prenamijeniti da funkcioniraju poput DRAM-a. „Ako niskobudžetne, visokokapacitetne NVMe uređaje redeployate kao radnu memoriju i dobijete potrebnu propusnost u fazi inferencije, možete temeljito preokrenuti ekonomiku cijelog procesa”, objasnio je.

Tvornica bez proizvodne trake

U konačnici, učinkovitija arhitektura ne znači samo bržu obradu tokena, nego i uštede energije i novca koje čine AI profitabilnom. „Surova je realnost da današnje AI tvornice nemaju proizvodnu traku. Inferencija je nevjerojatno neučinkovita, što napuhuje cijenu tokena”, zaključio je Bercovici. „Oni koji prvi uvedu ‘traku’ i optimiziraju inferenciju mogli bi steći prednost koju konkurencija neće moći stići.”

#openai#claude-code#cursor#val-bercovici#weka

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Egzodus iz Thinking Machines Laba: suparništva, ljubavna veza i povratak OpenAI-ju
Odlazak dvojice suosnivača i nekoliko istraživača iz Thinking Machines Laba prema OpenAI-ju otkriva unutarnje nesuglasice, navodnu aferu i utrku za višestruko većom valuacijom.

min čitanja

Više

Tehnologija

Američki tech magazin najavio raspravu: „Dobrodošli u kinesko stoljeće”
Online panel 21. siječnja okuplja novinare kako bi raspravili globalni uspon Kine u tehnologiji.

min čitanja

Više

Tehnologija

Godina 2026. najavljuje prekretnicu za električne automobile
CES pokazao manjak novih automobila, a kineski BYD prestigao Teslu; modeli za 2026. obećavaju više od 480 km dosega, 800 V punjenje i visoke cijene.

min čitanja

Više

Tehnologija

Iran priprema trajni prekid s globalnim internetom, pristup bi postao privilegij režima
Teheran, prema upozorenju aktivista, planira dopustiti međunarodni internet samo provjerenim pojedincima, dok bi ostatak populacije bio ograničen na zatvorenu nacionalnu mrežu.

min čitanja

Više

Tehnologija

Robotska premijera u Biogradu: humanoidna Tonka održala govor umjesto gradonačelnika
Na svečanoj sjednici Dana Grada Biograda na Moru debitirala je prva hrvatska humanoidna robotica, hvaleći 19-godišnji mandat gradonačelnika Ivana Kneza.

min čitanja

Više

Tehnologija

Daiwa „Air rotor” i „Mag sealed” mijenjaju pravila igre u ribolovu
Japanski proizvođač predstavio je dvije ključne inovacije koje produžuju vijek role i smanjuju težinu opreme, a već su se proširile s premium modela na širu ponudu.

min čitanja

Više

Tehnologija

Njemački Black Forest Labs lansirao brze AI modele FLUX.2 [klein]
Start-up bivših inženjera Stability AI predstavio otvorene slikovne modele od 4 i 9 milijardi parametara, optimizirane za brzinu i potrošnju resursa.

min čitanja

Više

Tehnologija

Google predstavio internu RL metodu za jasnije zaključivanje AI modela
Nova Googleova tehnika „internal RL” usmjerava interne procese LLM-ova prema korak-po-korak rješenjima, smanjujući halucinacije i otvarajući put autonomnim agentima.

min čitanja

Više

Tehnologija

AI folk-pop hit izbačen sa službene švedske top-liste
Diskografska udruga IFPI Sweden uklonila je folk-pop hit „Jag vet, du är inte min” s nacionalne ljestvice jer je pjesma, uključujući vokal, stvorena umjetnom inteligencijom.

min čitanja

Više

Tehnologija

Bivši čelnici USDS-a pokreću projekt za obnovu digitalnih servisa nakon „DOGE” eksperimenta
Skupina bivših stručnjaka USDS-a pokrenula je reformni projekt kako bi popravila štetu nastalu nakon Trumpovog „DOGE” preuzimanja državnih digitalnih servisa, zadržavajući pritom potrebnu odlučnost u borbi protiv birokracije.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Najčitanije

Nogomet

By The logo is from the following website: https://www.realmadrid.com/, Fair use, https://en.wikipedia.org/w/index.php?curid=35239667

Real Madrid slomio Levante i prišao Barceloni na bod
Mbappé i Asencio u sedam minuta riješili utakmicu, a Real Madrid ostao u tijesnoj utrci za naslovom s Barcelonom.
By Helfer Emilio - Own work, CC0, https://commons.wikimedia.org/w/index.php?curid=168449511

min čitanja

Više

Nogomet

By http://www.mancity.com/, Fair use, https://en.wikipedia.org/w/index.php?curid=51208953By http://hospitalityguide.manutd.com/global_assets/Wine_List.pdf, Fair use, https://en.wikipedia.org/w/index.php?curid=30961834

United pod Carrickom šokirao City i preskočio Liverpool
Bryan Mbeumo i Dion Dorgu srušili su City, a Carrick debitirao pobjedom koja Unitedu donosi skok na četvrto mjesto.

min čitanja

Više

Biznis

Stečajni upravitelj izbacuje Todorića: Bogojević preuzeo nizozemske tvrtke u središtu arbitraže protiv Hrvatske
Zoran Bogojević suspendirao je Ivicu Todorića i preuzeo kontrolu nad Adria Groupom, ključnim za arbitražu protiv Hrvatske vrijednu potencijalno više milijardi dolara.

min čitanja

Više

Politika

Sindikat znanosti optužuje Piletića za urušavanje socijalnog dijaloga
Nezavisni sindikat znanosti prozvao je ministra rada Marina Piletića da uništava socijalni dijalog, unatoč pohvalama premijera Plenkovića.

min čitanja

Više

Najnovije

Politika

Sitarski: Trumpov upad u Venezuelu otkriva povratak gole realpolitike

Politika

Sukob oko Vrhovnog suda prijeti blokadom i Ustavnog suda

Lifestyle

Stručnjak savjetuje: kako sigurno zagrijati motor i izbjeći skupe kvarove

Politika

Museveni osvojio sedmi mandat unatoč optužbama za prijevaru

Vijesti

Princ Albert prošao planiranu operaciju vlasišta

Politika

Matijević traži hitnu sjednicu o Karepovcu: „Otpad prijeti Splitu, kapaciteti se pune do kraja godine”

Sport

Navijači u nevjerici: u Malmöu pivo i Coca-Cola jeftiniji nego u zagrebačkoj Areni

Politika

HDZ u Otočcu obilježio 36 godina od osnutka Inicijativnog odbora za Liku, Gacku i Krbavu

Sport

Italija s mukom nad Gruzijom, obračun s Hrvatskom odlučuje polufinalista

Sport

Delago konačno slomila led: prva pobjeda u Tarvisiju, Vonn i dalje dominira poretkom

Vijesti

Njemačka redateljica Mascha Schilinski: od canneske senzacije do osam nominacija za europske filmske nagrade