CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

15. siječnja 2026, 14:48

Skriveni „memory wall” koči razvoj agentičkog AI-ja

GPU-ovi gube do 40 % vremena na ponavljanje izračuna jer KV-keš ne stane u memoriju, pokazuje analiza CTO-a tvrtke WEKA.

min. čitanja

XFacebookWhatsApp

Rast agentičkih sustava umjetne inteligencije otkrio je neočekivanu usku grla: nedostatak radne memorije na GPU-ovima. Ključni problem nisu procesorske jedinice ni veličina modela, nego Key-Value (KV) keš koji čuva kontekst svake interakcije.

„Kad gledamo infrastrukturu inferenciranja, izazov nije u GPU ciklusima. To je prvenstveno problem GPU memorije”, pojašnjava Shimon Ben-David, glavni tehnološki direktor tvrtke WEKA.

Kako transformeri funkcioniraju • Svaki izgovoreni ili napisani token sprema se u KV-keš. • Što je prozor konteksta dulji, to je potrošnja memorije veća. • Najnapredniji GPU-ovi nude najviše 288 GB brze HBM memorije, a u istoj treba smjestiti i sam model.

Kad nema mjesta, sustav izbacuje starije podatke, pa pri sljedećoj potrebi ponovno popunjava KV-keš. Taj ciklus „prefill – dekodiranje – ponovno prefill” vodi do: • oko 40 % izgubljenog vremena i energije na redundantne izračune, • povećane latencije i poskupljenja rada u oblaku, • lošijeg korisničkog iskustva, osobito u aplikacijama poput pisanju koda ili obradi poreznih prijava koje zahtijevaju postojani kontekst.

Zašto dodatni GPU-ovi ne pomažu Nadogradnja hardvera samo multiplicira isti nedostatak memorije. Svaki novi akcelerator ponavlja ciklus izbacivanja i popunjavanja, pa trošak i potrošnja energije linearno rastu, a temeljni problem ostaje.

WEKA-ino rješenje: proširena memorija Tvrtka predlaže „Augmented Memory Grid” i tzv. token warehousing – premještanje KV-keša izvan samog GPU-a u brzu, zajedničku memorijsku „skladišnu mrežu” (NeuralMesh). Time se: • oslobađa prostor na akceleratoru, • sprječava izbacivanje podataka, • smanjuje ponovni preračun i ukupni trošak inferenciranja.

„Stalno promatramo GPU-ove koji u produkciji izračunavaju iste stvari iznova”, kaže Ben-David, upozoravajući da nevidljivi gubici već nagrizaju marže tvrtki koje su AI agente uvele u radne procese.

Kako industrija prelazi iz eksperimentalnih u stvarne radne opterećenja, rješavanje ovog „memory walla” postaje presudno. Bez dugoročnog odgovora, ambicija o sveprisutnim, kontekstualno svjesnim AI asistentima mogla bi naići na – ograničenje kapaciteta memorije.

#weka#shimon-ben-david#augmented-memory-grid#neuralmesh#gpu-memorija

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Waymo poziva stanovnike Washingtona na pritisak vlastima radi odobrenja robotaksija
Waymo je pokrenuo masovnu kampanju e-mailova kako bi natjerao vlasti Washingtona, DC, da dopuste potpuno autonomne robotaksije.

min čitanja

Više

Tehnologija

Misteriozni kineski klikovi preplavili malu internetsku stranicu iz Kolumbije
Nišna stranica o duhovima i izvanzemaljcima, pisana na španjolsko-engleskoj mješavini, odjednom prima većinu prometnih klikova iz Kine i Singapura, zbunjujući svojeg kolumbijskog vlasnika.

min čitanja

Više

Tehnologija

Google u Chrome Canaryju uvodi WebMCP i otvara web za izravnu suradnju s AI agentima
Eksperimentalna verzija Chromea dobila je WebMCP, novi protokol koji AI agentima daje izravan, strukturiran pristup funkcijama web-stranica.

min čitanja

Više

Tehnologija

OpenAI predstavio GPT-5.3-Codex-Spark: 15 puta brži model za kodiranje u stvarnom vremenu
OpenAI se udružio s Cerebras Systemsom kako bi lansirao ultrabrzi model za kodiranje, prvi put izvan Nvidia infrastrukture.

min čitanja

Više

Tehnologija

‘Hakirani smo’: splitski klubovi Boiler i Olive Tree prijavili milijunske gubitke
Vlasnici splitskih klubova tvrde da su kibernetičkim napadom ostali bez milijunskih prihoda, a u slučaju se spominju i visoko pozicionirani akteri.

min čitanja

Više

Tehnologija

Split dobio pametne semafore, vozači prisiljeni mijenjati navike
Novi inteligentni sustav upravljanja prometom obuhvatio je 86 raskrižja u Splitu i Solinu, donio videonadzor i analitiku te primorao vozače na nove rituale za volanom.

min čitanja

Više

Tehnologija

Bellagent lansirao AI agente koji male tvrtke pokreću u nekoliko minuta
Američki startup Bellagent predstavio AI agente koji uklanjaju kompleksnost i troškove implementacije umjetne inteligencije u malim i srednjim poduzećima.

min čitanja

Više

Tehnologija

TTP optužuje Muskov X da zarađuje na iranskoj državi unatoč sankcijama
Izvješće Tech Transparency Projecta tvrdi da je više od dvadeset iranskih državnih profila dobilo plaćenu oznaku X Premium, čime je Muskovoj platformi navodno omogućeno stjecanje prihoda unatoč američkim sankcijama.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Riječke medicinske srednjoškolce oduševila najveća simulacijska operacijska dvorana u Europi
Učenici trećeg razreda Medicinske škole u Rijeci posjetili Institut Alessandro Volta u Italiji, gdje su isprobali najsuvremeniju medicinsku opremu i najavili daljnju STEM suradnju.

min čitanja

Više

Tehnologija

EU otvara NanoIC i ulaže 700 milijuna eura u novu pilot-liniju za čipove
U Leuvenu je otvoren NanoIC, projekt vrijedan 2,5 milijarde eura, s ciljem ubrzanja europske proizvodnje poluvodiča.

min čitanja

Više

Najčitanije

Nogomet

Ćorluka nakon ždrijeba Lige nacija: Hrvatsku tretiraju kao velesilu
Vatreni će u skupini 3 Lige nacija igrati protiv Španjolske, Engleske i Češke, a pomoćni trener Vedran Ćorluka naglašava da ih nogometni svijet već gleda kao velesilu.

min čitanja

Više

Vijesti

Muškarac na Mertojaku nožem nasrnuo na policajca, spasila ga zaštitna oprema
Drama u Splitu: psihički bolesni muškarac napao policajca nožem tijekom prisilnog privođenja, no službenik je ostao neozlijeđen zahvaljujući pancirki.

min čitanja

Više

Najnovije

Politika

Sánchez negoduje: Španjolska izostavljena iz novog njemačko-talijanskog „kluba konkurentnosti”

Biznis

EU u južnoj ofenzivi: novi trgovinski sporazumi kao odgovor na globalni pomak

Lifestyle

Pulska liječnica i pjesnikinja otkriva zbirku „Narančasto i plavo” u Knjižnici Veruda

Vijesti

Pula užurbano gradi Mornarički muzej u zgradi nekadašnje „Arena trikotaže”

Sport

Izložba raritetnih memorabilija razbija mitove o povijesti Hajduka

Tehnologija

Waymo poziva stanovnike Washingtona na pritisak vlastima radi odobrenja robotaksija

Tehnologija

Misteriozni kineski klikovi preplavili malu internetsku stranicu iz Kolumbije

Vijesti

Lopar kreće u temeljitu obnovu vodovoda

Vijesti

Američki carinski nadzornik optužen za skrivanje nelegalne rođakinje

Lifestyle

Porin otkrio nominacije: Mangroove predvodi listu, Baby Lasagna i Parni Valjak u stopu

Politika

Pentagon Europi: Pojačajte borbenu spremnost, SAD smanjuje snage na kontinentu