CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

13. veljače 2026, 06:18

Nvidia predstavila DMS: do osam puta manji memorijski trošak zaključivanja velikih jezičnih modela

DMS komprimira KV spremnik LLM-ova, omogućuje dublje „razmišljanje” i do pet puta veći protok korisničkih upita bez gubitka točnosti.

min. čitanja

XFacebookWhatsApp

Nvidia je razvila tehniku dynamic memory sparsification (DMS) koja, prema internim mjerenjima, smanjuje memorijski trošak zaključivanja velikih jezičnih modela (LLM-ova) do osam puta, a pritom održava ili čak poboljšava njihovu točnost.

LLM-ovi pri rješavanju složenih zadataka generiraju tzv. chain-of-thought tokene, čime raste njihov privremeni spremnik ključ-vrijednost (KV cache). Kako spremnik linearno buja, GPU-ovi troše sve više vremena na dohvat podataka umjesto na izračun, što povećava latenciju i ograničava broj paralelnih korisnika. „Pitanje nije samo o količini hardvera; radi se o tome obrađuje li vaša infrastruktura 100 niti zaključivanja ili 800 niti za isti trošak”, istaknuo je Piotr Nawrot, viši inženjer dubokog učenja u Nvidiji.

Za razliku od prijašnjih heurističkih rješenja – primjerice kliznih prozora koji jednostavno brišu starije tokene – DMS ugrađuje inteligentni mehanizam unutar postojećeg modela. Tijekom svega tisuću dodatnih koraka učenja, dio neurona u slojevima pozornosti prerasporedi se kako bi za svaki token generirao signal „zadrži” ili „izbaci”. Ključna je i funkcija „odgođene deložacije”: token označen za brisanje ostaje u spremniku još kratko vrijeme, što modelu pruža priliku da izvuče preostale informacije prije konačnog uklanjanja.

U testovima na modelima Qwen-R1 i Llama 3.2 DMS je pomaknuo tzv. Pareto-frontu odnosa cijene i učinka. Na matematičkom benchmarku AIME 24, Qwen-R1 32B opremljen DMS-om ostvario je 12 bodova bolji rezultat od standardne inačice pri jednakom memorijskom budžetu. U "needle-in-a-haystack" provjerama dugoga konteksta, varijante s DMS-om čak su nadmašile osnovne modele, jer aktivno održavaju „čistiji” i relevantniji kontekst.

Praktične koristi najvidljivije su u propusnosti sustava. Na modelu Qwen3-8B DMS je zadržao istu točnost, ali isporučio do pet puta više odgovora u sekundi, čime jedan poslužitelj može poslužiti višestruko više korisnika bez dodatnog hardvera.

DMS je objavljen u sklopu Nvidijine biblioteke KVPress i kompatibilan je s uobičajenim Hugging Face cjevovodima i FlashAttentionom, pa za uvođenje nije potrebno prilagođavati CUDA jezgre. Tehnika radi i s novijim arhitekturama poput Multi-Head Latent Attentiona, a u Nvidiji očekuju da će „upravljanje memorijom postati zaseban, inteligentan sloj AI-stoga”.

„Tek smo zagrebli površinu onoga što je moguće i uvjereni smo da će se skaliranje tijekom izvođenja i dalje razvijati”, zaključuje Nawrot.

#nvidia#hugging-face#piotr-nawrot#aime#latent-attention
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

„Screenmaxxeri”: ljudi koji gotovo 19 sati dnevno provode pred ekranom
Fenomen „screenmaxxera” otkriva ljude koji gotovo sav dan provode na mobitelu, a na upozorenja o štetnosti gledaju s podsmijehom.

min čitanja

Više

Tehnologija

Pićanski poduzetnici uče kako iskoristiti umjetnu inteligenciju
Na susretu poduzetnika u Pićnu stručnjak Dean Benazić pokazao je kako umjetna inteligencija može unaprijediti lokalno poslovanje, pri čemu podaci ostaju pod kontrolom domaćih tvrtki.

min čitanja

Više

Tehnologija

Vertovšek upozorava na tehnofeudalizam i nadolazeću eru umjetne inteligencije
Komunikacijski stručnjak Nenad Vertovšek opisuje kako tehnofeudalizam potiskuje autentičnost dok umjetna inteligencija prelazi granice „umjetnoga”.

min čitanja

Više

Tehnologija

FBI-jev slučaj u Teksasu razotkrio propust u iOS-u: dohvaćene i izbrisane Signal poruke
FBI-jeva istraga u Teksasu otkrila je da iPhoneovi pohranjuju kopije enkriptiranih Signal poruka kroz push notifikacije, što omogućuje dohvat i nakon brisanja aplikacije.

min čitanja

Više

Tehnologija

Kombinacija vida i ugljikova dioksida otkriva kako komarci pronalaze ljude
Velika analiza leta komaraca otkriva da se insekti najviše približe čovjeku kada istodobno vide tamu i osjete CO₂, otvarajući put učinkovitijim zamkama.

min čitanja

Više

Tehnologija

Mali centar disanja u mozgu otkriven kao skriveni okidač hipertenzije
Nova studija otkriva da lateralno parafacijalno područje mozga potiče sužavanje krvnih žila i povišenje tlaka, nudeći objašnjenje za neuspjeh standardnih terapija.

min čitanja

Više

Tehnologija

Život na Mjesecu: manje gravitacije, veći rizici za ljudsko zdravlje
Novo istraživanje ističe ozbiljne fiziološke posljedice smanjene gravitacije, radijacije i poremećenog ritma dana i noći koje bi ljudi morali savladati za život na Mjesecu.

min čitanja

Više

Tehnologija

Humanoidna robotica Tonka zvijezda pazinskoga Festivala strukovnih zanimanja
Peti Festival strukovnih zanimanja u Pazinu predstavit će 15 škola, 26 programa i prvog hrvatskog humanoidnog robota Tonku.

min čitanja

Više

Tehnologija

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234
Zapadne službe razotkrile opsežnu kampanju ruskih hakera Fancy Bear
Sigurnosne službe više zapadnih zemalja otkrile su da je ruska skupina Fancy Bear godinama hakirala Wi-Fi rutere, ciljajući vojne i državne sustave te krala lozinke i e-mailove.

min čitanja

Više

Tehnologija

FBI pozvao Amerikance da dvaput razmisle prije instalacije popularnih kineskih aplikacija
Zbog kineskih zakona o nadzoru FBI je izdao upozorenje Amerikancima da budu oprezni s aplikacijama koje traže opsežan pristup podacima, a razvijene su izvan SAD-a.

min čitanja

Više

Najčitanije

Vijesti

Šibensko-kninska županija zabranila roštilje i logorske vatre zbog visokog rizika od požara
Vatrogasna zajednica Šibensko-kninske županije privremeno je zabranila svako paljenje na otvorenom, uključujući roštilje i logorske vatre, upozoravajući da će svaki dim tretirati kao požar i sankcionirati prekršitelje.

min čitanja

Više

Politika

SAD prekida pregovore s Iranom: „Vraćamo se kući, nema dogovora”
Američki potpredsjednik J. D. Vance objavio je prekid povijesnih trilateralnih pregovora u Pakistanu nakon što Iran nije prihvatio ključni zahtjev Washingtona o nuklearnom programu.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Vijesti

Čuvao stado od vukova pa zapalio šumu kraj Šibenika

Sport

Riječani pregazili Dinamo: Ogirzović vodio Kvarner do uvjerljivih 96:67

Vijesti

Zagrebački slikar ostaje bez ateljea: „Rekli su mi da se mogu pakirati na ulicu”

Lifestyle

Tar ugostio 15. državno natjecanje u rezidbi maslina

Vijesti

Seksističko uznemiravanje u daruvarskom kafiću: dvojac prijavljen zbog vrijeđanja 21-godišnjakinje

Sport

Rijeka i Osijek otvaraju bogatu nedjelju SuperSport HNL-a

Vijesti

Gradonačelnik Labina čestitao pravoslavni Uskrs

Vijesti

Zagonetno stvorenje s videa otkrilo staroga susjeda Jadrana: bobuljak

Lifestyle

Sobne biljke nisu lijek za pelud, ali mogu ublažiti tegobe

Tehnologija

„Screenmaxxeri”: ljudi koji gotovo 19 sati dnevno provode pred ekranom

Vijesti

Zastoji na Istarskom ipsilonu i brzoj cesti Solin–Klis