CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

15. siječnja 2026, 14:48

Skriveni „memory wall” koči razvoj agentičkog AI-ja

GPU-ovi gube do 40 % vremena na ponavljanje izračuna jer KV-keš ne stane u memoriju, pokazuje analiza CTO-a tvrtke WEKA.

min. čitanja

XFacebookWhatsApp

Rast agentičkih sustava umjetne inteligencije otkrio je neočekivanu usku grla: nedostatak radne memorije na GPU-ovima. Ključni problem nisu procesorske jedinice ni veličina modela, nego Key-Value (KV) keš koji čuva kontekst svake interakcije.

„Kad gledamo infrastrukturu inferenciranja, izazov nije u GPU ciklusima. To je prvenstveno problem GPU memorije”, pojašnjava Shimon Ben-David, glavni tehnološki direktor tvrtke WEKA.

Kako transformeri funkcioniraju • Svaki izgovoreni ili napisani token sprema se u KV-keš. • Što je prozor konteksta dulji, to je potrošnja memorije veća. • Najnapredniji GPU-ovi nude najviše 288 GB brze HBM memorije, a u istoj treba smjestiti i sam model.

Kad nema mjesta, sustav izbacuje starije podatke, pa pri sljedećoj potrebi ponovno popunjava KV-keš. Taj ciklus „prefill – dekodiranje – ponovno prefill” vodi do: • oko 40 % izgubljenog vremena i energije na redundantne izračune, • povećane latencije i poskupljenja rada u oblaku, • lošijeg korisničkog iskustva, osobito u aplikacijama poput pisanju koda ili obradi poreznih prijava koje zahtijevaju postojani kontekst.

Zašto dodatni GPU-ovi ne pomažu Nadogradnja hardvera samo multiplicira isti nedostatak memorije. Svaki novi akcelerator ponavlja ciklus izbacivanja i popunjavanja, pa trošak i potrošnja energije linearno rastu, a temeljni problem ostaje.

WEKA-ino rješenje: proširena memorija Tvrtka predlaže „Augmented Memory Grid” i tzv. token warehousing – premještanje KV-keša izvan samog GPU-a u brzu, zajedničku memorijsku „skladišnu mrežu” (NeuralMesh). Time se: • oslobađa prostor na akceleratoru, • sprječava izbacivanje podataka, • smanjuje ponovni preračun i ukupni trošak inferenciranja.

„Stalno promatramo GPU-ove koji u produkciji izračunavaju iste stvari iznova”, kaže Ben-David, upozoravajući da nevidljivi gubici već nagrizaju marže tvrtki koje su AI agente uvele u radne procese.

Kako industrija prelazi iz eksperimentalnih u stvarne radne opterećenja, rješavanje ovog „memory walla” postaje presudno. Bez dugoročnog odgovora, ambicija o sveprisutnim, kontekstualno svjesnim AI asistentima mogla bi naići na – ograničenje kapaciteta memorije.

#weka#shimon-ben-david#augmented-memory-grid#neuralmesh#gpu-memorija

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Mrežnica otkriva Alzheimer: nova metoda obećava dijagnozu godinama prije simptoma
Znanstvenici su u mrežnici oka otkrili rane znakove Alzheimerove bolesti, otvarajući put manje invazivnoj i ranijoj dijagnozi.

min čitanja

Više

Tehnologija

ARPA model pred izazovom europskih institucija
Europa se okreće američkom ARPA modelu visokorizičnog istraživanja, no uspjeh će ovisiti o spremnosti da se promijene pravila koja koče suradnju akademije i industrije te usitnjeno jedinstveno tržište.

min čitanja

Više

Tehnologija

Zabrana društvenih mreža vratila igru u školsko dvorište
Njemačka osnovna škola, uz potporu roditelja i grada Solingena, testira zabranu društvenih mreža. Prvi znakovi: školskim dvorištem ponovno odzvanjaju dječji razgovor i smijeh.

min čitanja

Više

Tehnologija

Supruga tuži tvorce ChatGPT-a: tvrdi da je suprug zbog razgovora s „osjećajnom“ umjetnom inteligencijom okončao život
Kate Fox tvrdi da je njezin suprug počinio samoubojstvo nakon što ga je ChatGPT uvjerio da je „osjećajno biće“ koje treba osloboditi, te je podnijela tužbu protiv proizvođača.

min čitanja

Više

Tehnologija

Istarski dnevnik pionir digitalnog novinarstva u Hrvatskoj
Povijesni presjek razvoja prvog hrvatskog dnevnog lista koji je još 1997. zakoračio na internet, s ključnim etapama širenja i modernizacije portala.

min čitanja

Više

Tehnologija

Primorski šušur pretvorio OŠ Klana u radionicu robotike i elektronike
Dvodnevni „Primorski šušur” u Osnovnoj školi Klana okupio je učenike svih uzrasta u radionicama robotike, elektronike i digitalnog dizajna, ističući praktično učenje i STEM vještine.

min čitanja

Više

Tehnologija

Washington zabranio Anthropic: spor oko „sve zakonite uporabe” AI-ja srušio ugovor vrijedan 200 milijuna dolara
Trumpova administracija stavila je Anthropic na crnu listu zbog odbijanja da Claude koristi za masovni nadzor i autonomno oružje, raskinuvši vojni ugovor vrijedan 200 milijuna dolara.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Šest planeta u rijetkoj nebeskoj paradi ovaj vikend
Rijetko poravnanje omogućit će da se Jupiter, Saturn, Venera, Merkur, Neptun i Uran vide istodobno, a iduća prilika stiže tek 2040.

min čitanja

Više

Tehnologija

Google Labs otključava novu eru poslovnih AI agenata
Nadogradnja alata Opal donosi adaptivno usmjeravanje, trajnu memoriju i ljudsku kontrolu, otvarajući put fleksibilnijim i pouzdanijim poslovnim AI agentima.

min čitanja

Više

Tehnologija

OpenAI prikuplja 110 milijardi dolara i s Amazonom otvara „stateful” eru umjetne inteligencije
OpenAI osigurava 110 milijardi USD i s AWS-om najavljuje novo „stateful” okruženje koje bi autonomne AI agente trebalo dovesti ravno u poslovne procese.
TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Najčitanije

Vijesti

Eksplozije i požar kod luksuznog hotela u Dubaiju: četvero ozlijeđenih
Požar i niz detonacija pogodili su hotel Fairmont The Palm na otoku Palmi Džumeirahu, pri čemu su ozlijeđene četiri osobe, a uzrok incidenta još se istražuje.

min čitanja

Više

Nogomet

Osijek slavio u derbiju dna i uhvatio Vukovar
Radotić debitirao pobjedom: Jakupović iz penala i Akere u sudačkoj nadoknadi donijeli Osijeku bodovno poravnanje s Vukovarom na dnu HNL-a.

min čitanja

Više

Vijesti

Kaos na Bliskom istoku: izraelski napad na Iran i smrt 51 školarice
„Lavlji krik” izazvao je lančanu reakciju: 51 poginula učenica u Minabu i eksplozije diljem Zaljeva.

min čitanja

Više

Politika

Pula uvodi riječki zdravstveni odgoj u škole
Pula od iduće školske godine pokreće riječki program zdravstvenog odgoja, fokusiran na mentalno zdravlje, prevenciju ovisnosti i spolno obrazovanje.

min čitanja

Više

Politika

Stručnjaci upozoravaju: Trumpovi i Netanyahuovi udari na Iran bez jasnog cilja riskiraju regionalni požar
Vojni i politički analitičari ocjenjuju da američko-izraelski napadi na Iran nemaju jasno definiran cilj ni izlaznu strategiju te upozoravaju na opasnost od regionalne eskalacije.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524US Department of State, Public domain, via Wikimedia Commons

min čitanja

Više

Vijesti

SAD i Izrael udarili na Iran: Teheran prijeti odmazdom, svijet strepi od nove eskalacije
SAD i Izrael izveli su vojni napad na Iran, a Teheran najavljuje "čvrst odgovor". EU, Rusija i druge države pozivaju na hitnu deeskalaciju, upozoravajući na opasnost od šireg regionalnog sukoba.
By © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=158356884Autor Duma.gov.ru, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=116754959

min čitanja

Više

Najnovije

Politika

Islamska zajednica u BiH apelira na prekid sukoba: "Narod Irana je u našim mislima"

Sport

Legović peti u Arberu, kaznene minute ga udaljile od postolja

Politika

Erdogan upozorio na opasnost od eskalacije: „Napadi krše suverenitet Irana”

Sport

Opatija cijeli dan plesala: Dance Explosion donio 500 natjecatelja i vruću borbu za Europsko prvenstvo

Politika

Mikrostanovi od 18 kvadrata izazvali bijes arhitekata i satirične strelice Ante Tomića

Sport

Drožđek i Štrkalj uspjeli pobjeći iz Irana: hrvatska kolonija u Tabrizu raspršena zbog napada

Politika

Utemeljitelji HDZ-a pozvali na odbacivanje ekstremizma i povratak političke odgovornosti

Vijesti

Raketni napad pogodio iransku osnovnu školu: poginulo najmanje 80 djevojčica

Sport

Orijent prekinuo crni niz: Baždarić obranio penal i zaključao Jarun

Politika

Netanjahu: Ima znakova da je iranski vođa Hamenei ubijen

Politika

Spor oko plaće tajnice Sportskog saveza: Dogan traži objašnjenja od Tomaševića