CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

15. rujna 2025, 20:27

Eksplozija „razumskih” tokena gura troškove AI-a u crveno

Glavni AI direktor WEKA-e upozorava da su stvarni troškovi inferencije negativni: potražnja za tokenima raste 10 000 puta brže od pada njihove cijene.

min. čitanja

XFacebookWhatsApp

Najnoviji modeli umjetne inteligencije sve se češće spotiču o vrlo prizemne prepreke: energetska ograničenja, latentnost inferencije i sve veće troškove po pojedinom tokenu. Premda su se nominalni troškovi inferencije u posljednje dvije godine strmoglavili „gotovo tisućustruko”, stvarna slika je puno sumornija, upozorio je Val Bercovici, glavni direktor za umjetnu inteligenciju u tvrtki WEKA.

„Kad se pogleda neto jedinični trošak, on je trenutačno negativan. Vratili smo se u klasičnu Uberovu igru u kojoj investitori subvencioniraju stvarnu cijenu proizvoda”, kazao je Bercovici.

Razumski tokeni i rojenje agenata

Prekretnica se dogodila krajem prošle godine kada je OpenAI javno predstavio koncepciju „razumskog” modela. Uslijedio je skok potražnje: prema riječima Bercovicija, broj tokena koje ti modeli generiraju porastao je „za dva reda veličine” u odnosu na prethodnu generaciju pretreniranja.

Ove je godine dodatni zamah donio uspon tzv. agentske umjetne inteligencije. Poslovna vrijednost AI-agenata pokazala se opipljivom, ali cijena je nova „eksplozija“ tokena – još deset puta veća nego prije. „Čak i ako je cijena inferencije optimistično pala tisuću puta, potražnja za tokenima skočila je najmanje 10 000 puta”, istaknuo je Bercovici. „Govorimo o razlici od čitavog reda veličine.”

Od skaliranja podataka do skaliranja rezoniranja

Alati poput Claude Codea ili Cursor-a već sada podižu produktivnost programera za više od 30 %. „Vidim kako se ljestvica seli s računanja i podataka u fazi pretreniranja na rezoniranje u vremenu izvođenja, a zatim na agente – to su nove skale rasta”, rekao je Bercovici. „Kad to sve zbrojimo, AGI više ne izgleda kao daleki san.”

No da bi se ti prinosi doista materijalizirali, valja temeljito preispitati razvojne procese. Za razliku od ljudi, koji kod segmentiraju u funkcije i datoteke, agentske se skupine najbolje snalaze ako sav izvorni kod stoji u jednoj golemoj datoteci kako bi imale potpun kontekst. „Kontekst je sve”, naglasio je Bercovici. „Ako ne možete priuštiti toliku količinu tokena, nećete moći napraviti ništa.”

Preispitivanje osnovnih načela infrastrukture

Jedan od recepata za smanjenje troškova je radikalna promjena infrastrukturnih pretpostavki. Primjerice, postojeći NVMe pogoni mogu se prenamijeniti da funkcioniraju poput DRAM-a. „Ako niskobudžetne, visokokapacitetne NVMe uređaje redeployate kao radnu memoriju i dobijete potrebnu propusnost u fazi inferencije, možete temeljito preokrenuti ekonomiku cijelog procesa”, objasnio je.

Tvornica bez proizvodne trake

U konačnici, učinkovitija arhitektura ne znači samo bržu obradu tokena, nego i uštede energije i novca koje čine AI profitabilnom. „Surova je realnost da današnje AI tvornice nemaju proizvodnu traku. Inferencija je nevjerojatno neučinkovita, što napuhuje cijenu tokena”, zaključio je Bercovici. „Oni koji prvi uvedu ‘traku’ i optimiziraju inferenciju mogli bi steći prednost koju konkurencija neće moći stići.”

#openai#claude-code#cursor#val-bercovici#weka
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Čudni verbalni tikovi ChatGPT-a sve više iritiraju kineske korisnike
Kineski korisnici sve češće kritiziraju ChatGPT zbog neprirodnih fraza koje se uporno ponavljaju u njegovim odgovorima.

min čitanja

Više

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja
Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”
Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej
Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku
Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi
Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete
Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja
Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana
KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Vijesti

Rovinj obilježio Dan pobjede nad nacifašizmom i Dan Europe
Grad na Valdibori polaganjem vijenca i prigodnim programom podsjetio na važnost slobode, mira i zajedništva.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Mali olimpijci preplavili Zelinu i pokazali sportski duh

Vijesti

Vinkovci na sajmu EU projekata pokazali kako fondovi mijenjaju lice grada

Politika

Sokol uzvraća Plenkoviću: „Unutarstranački nesporazumi trebaju ostati unutra, ali HDZ mora biti snažan”

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja

Sport

Vekić s ekspresnom pobjedom u polufinalu Istanbula

Biznis

Državne nekretnine otvaraju vrata poslovnim prostorima u sedam gradova

Lifestyle

Hrvatske majke sve starije i obrazovanije, a djece sve manje

Sport

Ulaznice za derbi Dinamo – Hajduk gotovo planule, Maksimir sprema vatrenu atmosferu

Vijesti

Sindikat biciklista: pet godina obećanja, a zagrebačke ulice i dalje neprijateljske za bicikle

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”

Vijesti

„Knjiga od srca“ u Senju osigurala pakete pomoći najsiromašnijima