CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

15. rujna 2025, 20:27

Eksplozija „razumskih” tokena gura troškove AI-a u crveno

Glavni AI direktor WEKA-e upozorava da su stvarni troškovi inferencije negativni: potražnja za tokenima raste 10 000 puta brže od pada njihove cijene.

min. čitanja

XFacebookWhatsApp

Najnoviji modeli umjetne inteligencije sve se češće spotiču o vrlo prizemne prepreke: energetska ograničenja, latentnost inferencije i sve veće troškove po pojedinom tokenu. Premda su se nominalni troškovi inferencije u posljednje dvije godine strmoglavili „gotovo tisućustruko”, stvarna slika je puno sumornija, upozorio je Val Bercovici, glavni direktor za umjetnu inteligenciju u tvrtki WEKA.

„Kad se pogleda neto jedinični trošak, on je trenutačno negativan. Vratili smo se u klasičnu Uberovu igru u kojoj investitori subvencioniraju stvarnu cijenu proizvoda”, kazao je Bercovici.

Razumski tokeni i rojenje agenata

Prekretnica se dogodila krajem prošle godine kada je OpenAI javno predstavio koncepciju „razumskog” modela. Uslijedio je skok potražnje: prema riječima Bercovicija, broj tokena koje ti modeli generiraju porastao je „za dva reda veličine” u odnosu na prethodnu generaciju pretreniranja.

Ove je godine dodatni zamah donio uspon tzv. agentske umjetne inteligencije. Poslovna vrijednost AI-agenata pokazala se opipljivom, ali cijena je nova „eksplozija“ tokena – još deset puta veća nego prije. „Čak i ako je cijena inferencije optimistično pala tisuću puta, potražnja za tokenima skočila je najmanje 10 000 puta”, istaknuo je Bercovici. „Govorimo o razlici od čitavog reda veličine.”

Od skaliranja podataka do skaliranja rezoniranja

Alati poput Claude Codea ili Cursor-a već sada podižu produktivnost programera za više od 30 %. „Vidim kako se ljestvica seli s računanja i podataka u fazi pretreniranja na rezoniranje u vremenu izvođenja, a zatim na agente – to su nove skale rasta”, rekao je Bercovici. „Kad to sve zbrojimo, AGI više ne izgleda kao daleki san.”

No da bi se ti prinosi doista materijalizirali, valja temeljito preispitati razvojne procese. Za razliku od ljudi, koji kod segmentiraju u funkcije i datoteke, agentske se skupine najbolje snalaze ako sav izvorni kod stoji u jednoj golemoj datoteci kako bi imale potpun kontekst. „Kontekst je sve”, naglasio je Bercovici. „Ako ne možete priuštiti toliku količinu tokena, nećete moći napraviti ništa.”

Preispitivanje osnovnih načela infrastrukture

Jedan od recepata za smanjenje troškova je radikalna promjena infrastrukturnih pretpostavki. Primjerice, postojeći NVMe pogoni mogu se prenamijeniti da funkcioniraju poput DRAM-a. „Ako niskobudžetne, visokokapacitetne NVMe uređaje redeployate kao radnu memoriju i dobijete potrebnu propusnost u fazi inferencije, možete temeljito preokrenuti ekonomiku cijelog procesa”, objasnio je.

Tvornica bez proizvodne trake

U konačnici, učinkovitija arhitektura ne znači samo bržu obradu tokena, nego i uštede energije i novca koje čine AI profitabilnom. „Surova je realnost da današnje AI tvornice nemaju proizvodnu traku. Inferencija je nevjerojatno neučinkovita, što napuhuje cijenu tokena”, zaključio je Bercovici. „Oni koji prvi uvedu ‘traku’ i optimiziraju inferenciju mogli bi steći prednost koju konkurencija neće moći stići.”

#openai#claude-code#cursor#val-bercovici#weka

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Pentagon koristio Claude u napadu na Iran unatoč Trumpovoj zabrani
Američka vojska oslanjala se na AI sustav Claude prilikom zračnih udara na Iran iako je Donald Trump nekoliko sati ranije izdao naredbu o prekidu suradnje s tvrtkom Anthropic.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Washington zabranio Anthropic: spor oko „sve zakonite uporabe” AI-ja srušio ugovor vrijedan 200 milijuna dolara
Trumpova administracija stavila je Anthropic na crnu listu zbog odbijanja da Claude koristi za masovni nadzor i autonomno oružje, raskinuvši vojni ugovor vrijedan 200 milijuna dolara.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Stručnjaci upozoravaju: nosivi AI uređaji mogu potkopati ljudsku autonomiju
Nadolazeća generacija nosivih AI uređaja mogla bi, upozoravaju stručnjaci, pretvoriti se iz pomoćnika u sofisticirani mehanizam manipulacije korisnicima.

min čitanja

Više

Tehnologija

Drniš digitalizira javne usluge i uvodi bibliokombi za udaljena sela
Dva nova projekta donose Drnišu e-usluge i pokretnu knjižnicu, čineći administraciju i knjige dostupnima svim mještanima.

min čitanja

Više

Tehnologija

Američka vojska prvi put u Iranu upotrijebila nove rojne dronove LUCAS
SAD je u udaru na Iran prvi put borbeno primijenio novu generaciju rojevnih dronova LUCAS, objavio je CENTCOM.

min čitanja

Više

Tehnologija

Piratski tok kulture: zašto milijuni na Bliskom istoku i u Sjevernoj Africi i dalje biraju ilegalni streaming
Sankcije, krhki bankarski sustavi i skupa dolarizirana pretplata guraju publiku Bliskog istoka i Sjeverne Afrike prema Telegramu, IPTV-u i dijeljenim diskovima umjesto prema Netflixu i Spotifyju.

min čitanja

Više

Tehnologija

Novi Jeep Compass podiže ljestvicu: više snage, pametnija tehnologija i vrhunski terenski potencijal
Jeep je predstavio novu generaciju modela Compass: napredniji ovjes, pet načina vožnje, potpuno digitalnu kabinu i autonomnu vožnju 2. razine.

min čitanja

Više

Tehnologija

‘Fantomski uređaji’ kradu vam brzinu interneta
Uswitch upozorava da kućni Wi-Fi mogu usporiti i neaktivni pametni uređaji, pa stručnjaci savjetuju ‘digitalno čišćenje’ mreže.

min čitanja

Više

Tehnologija

AI robot iz Šangaja postaje novi sparing partner tenisačima
Pongbot Pace S Pro, AI robot-trener iz Kine, nudi brzine do 122 km/h, 564 vježbe i osam sati autonomije, ali s 21 kg traži snažnog vlasnika.

min čitanja

Više

Tehnologija

Što znači lampica za tlak u gumama i kako TPMS čuva sigurnost na cesti
Kontrolna lampica TPMS-a upozorava na opasni pad tlaka u gumama. Objašnjavamo kako sustav radi, koje vrste postoje i što učiniti kada se upali.

min čitanja

Više

Najčitanije

Vijesti

Splićanka smiruje paniku: „Dubai je i dalje na nogama unatoč iranskim projektilima”
Sanja Guć Babić, hrvatska investitorica koja posluje u Ujedinjenim Arapskim Emiratima, opisuje stanje u Dubaiju nakon iranskih raketnih napada i objašnjava kako vlasti sprječavaju širenje panike.

min čitanja

Više

Nogomet

Tottenham pod Igorom Tudorom drugi put zaredom pao u londonskom derbiju
Tottenham je pod hrvatskim trenerom Igorom Tudorom u 28. kolu Premier lige izgubio 2:1 od Fulhama, upisavši drugi uzastopni poraz u londonskim derbijima.
Football.ua, CC BY-SA 3.0 GFDL, via Wikimedia Commons

min čitanja

Više

Vijesti

Svećenika vrijeđali na obljetnici logora u Jablanici
Na 32. godišnjicu gašenja ratnog logora za Hrvate u Jablanici, katoličkog svećenika verbalno je napao muškarac koji ga je nazvao „ustašom”; jedan počinitelj uhićen.

min čitanja

Više

Nogomet

Rijeka nadigrala Lokomotivu i vratila se na treće mjesto
Domaći su slavili 2:0 golovima Dantasa i Adu-Adjeija, uz poništeni pogodak Lokosa na startu susreta.
By Ispravljac2810 - Own work, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=173921487

min čitanja

Više

Nogomet

Brekalo opet strijelac: Hrvat zabio drugi put zaredom za Herthu
Hrvatski nogometaš zabio je i drugo kolo zaredom za Herthu Berlin, potvrdivši povratak u golgetersku formu.

min čitanja

Više

Najnovije

Lifestyle

Deseta sezona showa „Tvoje lice zvuči poznato“ stiže s pojačanjem u žiriju

Vijesti

Bijeg kroz Podravsku magistralu završio privođenjem

Vijesti

Osječki par zaglavio na Zanzibaru zbog otkazanih letova preko Dubaija

Sport

Svirid uzeo broncu na Grand Slamu u Taškentu

Sport

Valencia jedva nadigrala Osasunu, gradski derbi u Sevilli završio bez pobjednika

Tehnologija

Stručnjaci upozoravaju: nosivi AI uređaji mogu potkopati ljudsku autonomiju

Sport

Livaković ostvario 300. nastup u dresu Dinama

Sport

Torcida okrenula Istru Pulu u nastavku i zakomplicirala borbu za doigravanje

Vijesti

Mještani Velog Iža traže trajektnu liniju i obnovu rive, grad obećao ulaganja

Politika

Anketa otkriva slabiju podršku Amerikanaca za napade na Iran

Vijesti

Osječanke zarobljene na Maldivima zbog napetosti na Bliskom istoku