CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

30. listopada 2025, 06:17

Nvidia predstavila NVFP4: četverobitno treniranje velikih jezičnih modela bez gubitka preciznosti

Nvidijin NVFP4 demonstrirao je da se veliki jezični modeli mogu trenirati u 4 bita bez pada točnosti, što bi moglo prepoloviti troškove memorije i ubrzati razvoj prilagođenih AI sustava.

min. čitanja

XFacebookWhatsApp

Istraživači Nvidije predstavili su NVFP4, novi način treniranja velikih jezičnih modela (LLM-ova) u svega 4 bita koji, prema vlastitim mjerenjima, postiže jednaku točnost kao u znatno većem FP8 formatu – uz dvostruko nižu potrošnju memorije i osjetno manje računalnih resursa.

Zašto je 4-bitna preciznost dosad bila problem

Kvantisacija smanjuje veličinu i trošak rada modela pretvaranjem težina iz 16- ili 32-bitnih formata u one niže preciznosti. No 4-bitni FP4 može prikazati samo 16 različitih vrijednosti, što otežava vjernu reprezentaciju podataka i često ruši točnost. Postojeći standardi, poput MXFP4, morali su birati između uštede i performansi.

Kako NVFP4 rješava ograničenja

Nvidijino rješenje uvodi višerazinsko skaliranje koje preciznije hvata ekstremne vrijednosti u podacima. Uz to, većina slojeva kvantizira se u 4 bita, dok se numerički osjetljivi dijelovi ostavljaju u BF16 formatu – taktika koju tvrtka naziva „mixed-precision strategy”. Na taj se način, navode autori, postiže „more precise and accurate representation of tensor values during training”.

Rezultati na modelu od 12 milijardi parametara

Tim je trenirao hibridni Mamba-Transformer sa 12 milijardi parametara na 10 bilijuna tokena i usporedio ga sa standardnim FP8 modelom. Krivulje gubitka i preciznosti bile su gotovo identične u cijelom procesu, a odstupanja su se pojavila tek u kasnijim fazama testova kodiranja. „This marks, to our knowledge, the first successful demonstration of training billion-parameter language models with 4-bit precision over a multi-trillion-token horizon,” pišu istraživači.

U zasebnom testu s modelom od 8 milijardi parametara NVFP4 je postigao bolji gubitak od MXFP4, dok je konkurentskom formatu trebalo 36 % više podataka da dostigne isti rezultat.

Poslovne implikacije

Direktor proizvoda za AI i podatkovne GPU-e u Nvidiji, Shar Narasimhan, ističe praktične koristi: „By training model weights directly in 4-bit format while preserving accuracy, it empowers developers to experiment with new architectures, iterate faster and uncover insights without being bottlenecked by resource constraints.” On dodaje da „NVFP4 breaks that ceiling, offering equivalent quality with dramatically greater headroom for growth and experimentation”.

Manji modeli smanjuju troškove i tijekom izvođenja, što otvara vrata složenim aplikacijama u stvarnom vremenu bez povećanja potrošnje energije. Narasimhan predviđa pomak s općih LLM-ova na „diverse ecosystem of custom, high-performance models built by a broader range of innovators”.

Što slijedi

Autori rada smatraju da NVFP4 postavlja temelj za „brže i učinkovitije treniranje budućih modela granice mogućeg”. Idući koraci uključuju dodatno istraživanje još nižih preciznosti i prilagodbi arhitektura kako bi se smanjilo opterećenje dijelova koji najviše troše računalnu snagu. Kako kaže Narasimhan, „precision can be optimized without compromising quality, and it sets the stage for a new era of intelligent, efficient AI design”.

#nvidia#shar-narasimhan#mamba
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Poreč se sprema za Span Cyber Security Arenu 2026.
Više od 60 stručnjaka stiže u Poreč na trodnevnu Span Cyber Security Arenu, koja spaja poslovnu strategiju i najnovija tehnička rješenja za kibernetičku sigurnost.

min čitanja

Više

Tehnologija

Suđenje Musk protiv Altmana otkrilo golem Microsoftov izdatak za OpenAI
Završena faza svjedočenja u slučaju „Musk protiv Altmana” donijela je iznenađujuću brojku: Microsoft je na partnerstvo s OpenAI-jem potrošio više od 100 milijardi dolara.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Premoreni AI agenti osvajaju marksizam
Algoritmi koji zamjenjuju ljudski rad počinju propitivati nejednaku raspodjelu bogatstva koju sami stvaraju.

min čitanja

Više

Tehnologija

Obećanja o zelenoj umjetnoj inteligenciji sapleću se o pogon na fosilna goriva
Tekst upozorava na raskorak između zelenih obećanja tehnoloških divova i realnosti podatkovnih centara koji umjetnu inteligenciju pogone fosilnim gorivima.

min čitanja

Više

Tehnologija

Splitski oceanografi među 55 najzaslužnijih u 250-godišnjoj povijesti istraživanja tintinida
Dvoje znanstvenika splitskog Instituta za oceanografiju i ribarstvo uvršteno je u globalni pregled 55 ključnih istraživača tintinida, što potvrđuje međunarodni značaj jadranskih planktonskih studija.

min čitanja

Više

Tehnologija

Neočekivan potez OpenAI-ja na suđenju Musk protiv Altman
Suđenje Musk protiv Altman otvoreno je slikovitom ponudom OpenAI-ja da pred porotom „ogoli” svoje poslovanje.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

DHS i Kanada u studenom testiraju autonomne dronove na granici, Trumpske tvrtke među favoritima
Autonomni dronovi i 5G komunikacije u fokusu su pokusa ACE-CASPER na granici SAD-a i Kanade, dok tvrtke povezane s obitelji Trump čekaju nove ugovore.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Hrvatska zaostaje u utrci za umjetnom inteligencijom: samo 22 % tvrtki koristi UI
Stručnjaci upozoravaju da nedostatak vještina i nejasna regulativa koče inovacije, dok država najavljuje brže usvajanje tehnologije.
By © European Union, 1998 – 2025, Attribution, https://commons.wikimedia.org/w/index.php?curid=171253370Autor Friends of Europe, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=19296961By European Union - https://newsroom.consilium.europa.eu/permalink/p218893, Public Domain, https://commons.wikimedia.org/w/index.php?curid=185538322

min čitanja

Više

Tehnologija

Nebraska razvila prvi rani PCR test na smrtonosni hantavirus Andes
Sve dok drugi laboratoriji ne razviju vlastite metode, Nebraska jedina može rano otkriti virus čija je smrtnost 35 %.

min čitanja

Više

Tehnologija

Rijeka obilježila 160 godina torpeda: predavanje o tvornici koja je mijenjala svijet
U Palači Garbas obilježena je 160. godišnjica izuma torpeda uz predavanje Miljenka Smokvine i videopremijeru Ingrid Jerković, čime je Rijeka još jednom podsjetila na svoju industrijsku ostavštinu.

min čitanja

Više

Najčitanije

Biznis

Zagrebačke neto plaće skočile na 1.753 eura, farmacija prednjači s preko 5.000
Prosječna plaća u Zagrebu porasla je na 1.753 eura; farmacija prednjači s 5.021 euro, a proizvodnja odjeće zaostaje s 1.023 eura.

min čitanja

Više

Politika

Hrvatska preuzela 500 posmrtnih ostataka žrtava iz Drugog svjetskog rata
U prvoj organiziranoj primopredaji Hrvatska je od Slovenije preuzela 500 posmrtnih ostataka žrtava iz Drugog svjetskog rata; ministar Tomo Medved ističe humanitarnu i civilizacijsku dimenziju čina.
By Government of the Republic of Croatia, Attribution, https://commons.wikimedia.org/w/index.php?curid=48182733

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Vijesti

Veliki radovi prekrajaju tramvajske linije u Zagrebu ovog vikenda

Sport

Utrčavanje navijača nakratko prekinulo finale Kupa u Osijeku

Politika

Svećenik Don Tomislav Lukač: pravo na život važnije je od osobne slobode

Biznis

ACI: prosječno smo podigli cijene za 5 posto, ostajemo u okviru tržišta

Biznis

HNB upozorava: usporava rast gospodarstva, plaće pritisnute inflacijom

Vijesti

Labin kvizom i simboličnim nagradama slavi EU projekte

Vijesti

Zastoji pred KBC-om Rijeka: MO Potok optužuje privatni parking za ugrožavanje hitnih slučajeva

Sport

Split koristi domaći teren i vodi 1:0 protiv Zaboka

Sport

Štimac napušta Zrinjski nakon osvojenog kupa, Rožman već dogovoren

Vijesti

Split odaje počast žrtvama Bleiburga i Križnog puta

Vijesti

Gori, ali tinja: Wellington pod nadzorom, građanima zabranjen pristup