CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

30. listopada 2025, 06:17

Nvidia predstavila NVFP4: četverobitno treniranje velikih jezičnih modela bez gubitka preciznosti

Nvidijin NVFP4 demonstrirao je da se veliki jezični modeli mogu trenirati u 4 bita bez pada točnosti, što bi moglo prepoloviti troškove memorije i ubrzati razvoj prilagođenih AI sustava.

min. čitanja

XFacebookWhatsApp

Istraživači Nvidije predstavili su NVFP4, novi način treniranja velikih jezičnih modela (LLM-ova) u svega 4 bita koji, prema vlastitim mjerenjima, postiže jednaku točnost kao u znatno većem FP8 formatu – uz dvostruko nižu potrošnju memorije i osjetno manje računalnih resursa.

Zašto je 4-bitna preciznost dosad bila problem

Kvantisacija smanjuje veličinu i trošak rada modela pretvaranjem težina iz 16- ili 32-bitnih formata u one niže preciznosti. No 4-bitni FP4 može prikazati samo 16 različitih vrijednosti, što otežava vjernu reprezentaciju podataka i često ruši točnost. Postojeći standardi, poput MXFP4, morali su birati između uštede i performansi.

Kako NVFP4 rješava ograničenja

Nvidijino rješenje uvodi višerazinsko skaliranje koje preciznije hvata ekstremne vrijednosti u podacima. Uz to, većina slojeva kvantizira se u 4 bita, dok se numerički osjetljivi dijelovi ostavljaju u BF16 formatu – taktika koju tvrtka naziva „mixed-precision strategy”. Na taj se način, navode autori, postiže „more precise and accurate representation of tensor values during training”.

Rezultati na modelu od 12 milijardi parametara

Tim je trenirao hibridni Mamba-Transformer sa 12 milijardi parametara na 10 bilijuna tokena i usporedio ga sa standardnim FP8 modelom. Krivulje gubitka i preciznosti bile su gotovo identične u cijelom procesu, a odstupanja su se pojavila tek u kasnijim fazama testova kodiranja. „This marks, to our knowledge, the first successful demonstration of training billion-parameter language models with 4-bit precision over a multi-trillion-token horizon,” pišu istraživači.

U zasebnom testu s modelom od 8 milijardi parametara NVFP4 je postigao bolji gubitak od MXFP4, dok je konkurentskom formatu trebalo 36 % više podataka da dostigne isti rezultat.

Poslovne implikacije

Direktor proizvoda za AI i podatkovne GPU-e u Nvidiji, Shar Narasimhan, ističe praktične koristi: „By training model weights directly in 4-bit format while preserving accuracy, it empowers developers to experiment with new architectures, iterate faster and uncover insights without being bottlenecked by resource constraints.” On dodaje da „NVFP4 breaks that ceiling, offering equivalent quality with dramatically greater headroom for growth and experimentation”.

Manji modeli smanjuju troškove i tijekom izvođenja, što otvara vrata složenim aplikacijama u stvarnom vremenu bez povećanja potrošnje energije. Narasimhan predviđa pomak s općih LLM-ova na „diverse ecosystem of custom, high-performance models built by a broader range of innovators”.

Što slijedi

Autori rada smatraju da NVFP4 postavlja temelj za „brže i učinkovitije treniranje budućih modela granice mogućeg”. Idući koraci uključuju dodatno istraživanje još nižih preciznosti i prilagodbi arhitektura kako bi se smanjilo opterećenje dijelova koji najviše troše računalnu snagu. Kako kaže Narasimhan, „precision can be optimized without compromising quality, and it sets the stage for a new era of intelligent, efficient AI design”.

#nvidia#shar-narasimhan#mamba

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Mamba-3 najavljuje zaokret u razvoju umjetne inteligencije
Istraživači s Carnegie Mellona i Princetona otvorili su kod Mambe-3, arhitekture koja želi ubrzati izvođenje velikih jezičnih modela i smanjiti troškove u odnosu na dominante transformere.

min čitanja

Više

Tehnologija

Nvidia lansirala agentički AI uz neviđenu sigurnosnu pratnju
Sigurnost je ovaj put stigla istodobno s platformom – pet tvrtki već štiti novi Nvidia AI stack.

min čitanja

Više

Tehnologija

Nvidia na GTC-u 2026 lansirao NemoClaw, sigurnosni okvir za "pandže" umjetne inteligencije
Na GTC-u 2026 u San Joseu Nvidia je predstavila NemoClaw, paket koji obećava siguran ulazak autonomnih AI agenata, tzv. „pandži”, u korporativno okruženje.

min čitanja

Više

Tehnologija

Pentagon tvrdi da nije povrijedio prava Anthropica
Ministarstvo obrane Sjedinjenih Država poručilo je sudu da zabrana Anthropicovih AI alata ne krši slobodu govora te brani odluku da tvrtku proglasi sigurnosnim rizikom; sudska odluka o privremenom ukidanju mjere očekuje se idući tjedan.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Nvidia smanjuje glad za memorijom velikih jezičnih modela novom tehnikom kodiranja
KV Cache Transform Coding komprimira memoriju transformera do 20 puta i ubrzava generiranje odgovora, najavljuje Nvidia.

min čitanja

Više

Tehnologija

Mistral AI predstavio Forge, platformu za potpuno prilagođeno treniranje poslovnih AI modela
Forge omogućuje poduzećima da u potpunosti treniraju i prilagođavaju AI modele na vlastitim podacima, produbljujući ambicije Mistral AI-ja da postane ključna infrastruktura za poslovnu umjetnu inteligenciju.

min čitanja

Više

Tehnologija

Langsmart demonstrirao 10,2 puta brži AI gateway uz latenciju ispod 300 ms
Platforma Smartflow postigla je 10,2 puta brži odziv i p95 latenciju od 285 ms na skromnom on-premises poslužitelju, a Langsmart poziva konkurente da objave vlastite standardizirane mjeriteljske podatke.

min čitanja

Više

Tehnologija

Audi oživljava kultni A2: povratak u električnom ruhu
Legendarni mali monovolumen vraća se kao A2 e-tron, ulazni električni model marke, uz najavu premijere u jeseni 2026. i cijenu ispod 35 000 eura.

min čitanja

Više

Tehnologija

AI agenti otvaraju pitanje identiteta: 1Password u središtu novog sigurnosnog izazova
Stručnjaci upozoravaju da autonomni AI agenti stvaraju nove rizike jer često koriste tuđe vjerodajnice, a 1Password nudi rješenje za sigurno upravljanje njihovim pristupom.

min čitanja

Više

Tehnologija

Svemirska cenzura nad Bliskim istokom: kineski sateliti ruše američku blokadu snimki
Kineski sateliti Jilin-1 izbijaju u prvi plan nakon što su američki operateri ograničili dostupnost snimaka nad Bliskim istokom, ostavljajući istraživače i javnost bez ključnih vizualnih podataka o ratu Izraela, SAD-a i Irana.

min čitanja

Više

Najčitanije

Nogomet

Sportski preokret: Sporting petardom izbacio Bodo Glimt iz Lige prvaka
Lisabonski Sporting izbrisao je norveških 0-3, u uzvratu slavio 5-0 i ukupno 5-3, te izborio četvrtfinale Lige prvaka.

min čitanja

Više

Nogomet

Argentina nakon otkazane Finalissime zakazala prijateljski ogled s Gvatemalom
Nakon što je Finalissima s europskim prvakom Španjolskom otkazana zbog sigurnosnih razloga, Argentina je za 31. ožujka dogovorila prijateljski dvoboj protiv Gvatemale u sklopu priprema za Svjetsko prvenstvo.

min čitanja

Više

Vijesti

Uhićen u Zenici zbog prijetnji „Ubijat ću kršćane” na TikToku
Muškarac iz Zeničko-dobojske županije prijetio masovnim ubojstvima kršćana tijekom TikTok prijenosa uživo pa ga je privela Federalna policija.

min čitanja

Više

Politika

Mojsilović tvrdi da nove srpske rakete nisu uperene prema susjedima
Načelnik Generalštaba Vojske Srbije tvrdi da kineske hipersonične rakete CM-400 nisu usmjerene prema Zagrebu, Sarajevu ni Podgorici, naglašavajući da Beograd ostaje posvećen miru i regionalnoj stabilnosti.
Sergei Bobylev, RIA Novosti, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Najnovije

Politika

Crna Gora zatvorila još jedno poglavlje na putu prema EU

Politika

Teheran prijeti „odlučnim i žalosnim” odgovorom nakon ubojstva sigurnosnog čelnika

Sport

Bronce za Saru Mikić i Lorenu Pipunić na kadetskom prvenstvu Hrvatske u judu

Vijesti

Noćni raketni napad iz Irana pogodio Tel Aviv

Tehnologija

Pentagon tvrdi da nije povrijedio prava Anthropica

Sport

Sudac fizički spriječio vodećeg maratonca; slijedi mu godinu dana zabrane

Vijesti

Opatija se pridružila borbi za spas liburnijskih maruna

Vijesti

Cijela dubrovačka jezgra pod zaštitom: strani vodiči smiju do Pila, dalje samo licencirani

Vijesti

Rinčić temeljito presložila upravna vijeća riječkih kulturnih ustanova

Tehnologija

Nvidia smanjuje glad za memorijom velikih jezičnih modela novom tehnikom kodiranja

Biznis

‘Rijeka Gateway’ vraća luku u igru za vrh Jadrana