CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

30. listopada 2025, 06:17

Nvidia predstavila NVFP4: četverobitno treniranje velikih jezičnih modela bez gubitka preciznosti

Nvidijin NVFP4 demonstrirao je da se veliki jezični modeli mogu trenirati u 4 bita bez pada točnosti, što bi moglo prepoloviti troškove memorije i ubrzati razvoj prilagođenih AI sustava.

min. čitanja

Istraživači Nvidije predstavili su NVFP4, novi način treniranja velikih jezičnih modela (LLM-ova) u svega 4 bita koji, prema vlastitim mjerenjima, postiže jednaku točnost kao u znatno većem FP8 formatu – uz dvostruko nižu potrošnju memorije i osjetno manje računalnih resursa.

Zašto je 4-bitna preciznost dosad bila problem

Kvantisacija smanjuje veličinu i trošak rada modela pretvaranjem težina iz 16- ili 32-bitnih formata u one niže preciznosti. No 4-bitni FP4 može prikazati samo 16 različitih vrijednosti, što otežava vjernu reprezentaciju podataka i često ruši točnost. Postojeći standardi, poput MXFP4, morali su birati između uštede i performansi.

Kako NVFP4 rješava ograničenja

Nvidijino rješenje uvodi višerazinsko skaliranje koje preciznije hvata ekstremne vrijednosti u podacima. Uz to, većina slojeva kvantizira se u 4 bita, dok se numerički osjetljivi dijelovi ostavljaju u BF16 formatu – taktika koju tvrtka naziva „mixed-precision strategy”. Na taj se način, navode autori, postiže „more precise and accurate representation of tensor values during training”.

Rezultati na modelu od 12 milijardi parametara

Tim je trenirao hibridni Mamba-Transformer sa 12 milijardi parametara na 10 bilijuna tokena i usporedio ga sa standardnim FP8 modelom. Krivulje gubitka i preciznosti bile su gotovo identične u cijelom procesu, a odstupanja su se pojavila tek u kasnijim fazama testova kodiranja. „This marks, to our knowledge, the first successful demonstration of training billion-parameter language models with 4-bit precision over a multi-trillion-token horizon,” pišu istraživači.

U zasebnom testu s modelom od 8 milijardi parametara NVFP4 je postigao bolji gubitak od MXFP4, dok je konkurentskom formatu trebalo 36 % više podataka da dostigne isti rezultat.

Poslovne implikacije

Direktor proizvoda za AI i podatkovne GPU-e u Nvidiji, Shar Narasimhan, ističe praktične koristi: „By training model weights directly in 4-bit format while preserving accuracy, it empowers developers to experiment with new architectures, iterate faster and uncover insights without being bottlenecked by resource constraints.” On dodaje da „NVFP4 breaks that ceiling, offering equivalent quality with dramatically greater headroom for growth and experimentation”.

Manji modeli smanjuju troškove i tijekom izvođenja, što otvara vrata složenim aplikacijama u stvarnom vremenu bez povećanja potrošnje energije. Narasimhan predviđa pomak s općih LLM-ova na „diverse ecosystem of custom, high-performance models built by a broader range of innovators”.

Što slijedi

Autori rada smatraju da NVFP4 postavlja temelj za „brže i učinkovitije treniranje budućih modela granice mogućeg”. Idući koraci uključuju dodatno istraživanje još nižih preciznosti i prilagodbi arhitektura kako bi se smanjilo opterećenje dijelova koji najviše troše računalnu snagu. Kako kaže Narasimhan, „precision can be optimized without compromising quality, and it sets the stage for a new era of intelligent, efficient AI design”.

#nvidia#shar-narasimhan#mamba

Slično

Biznis

Američki tehnološki divovi pojačavaju ulaganja u umjetnu inteligenciju unatoč bojazni od balona
Microsoft, Meta i Google objavili su rekordne prihode i najavili nove milijarde za AI infrastrukturu, dok analitičari upozoravaju na moguće pregrijavanje tržišta.

min čitanja

Više

Tehnologija

Prvi hrvatski internetski dnevnik prošao četiri velike transformacije
Istarski dnevnik, prvi hrvatski tiskani medij na internetu, prošao je četiri ključne digitalne nadogradnje od 1997. do danas.

min čitanja

Više

Tehnologija

Kina u petak šalje najmlađeg astronauta i četiri miša na postaju Tiangong
Misija Shenzhou-21 kreće u petak navečer; 32-godišnji Wu Fei bit će najmlađi Kinez u svemiru, a na Tiangong stižu i prvi kineski orbitalni pokusi na miševima.

min čitanja

Više

Tehnologija

Split otvara besplatnu akademiju za e-Građane
Grad i Tehnološki park Split pokreću besplatan program koji građane uči korištenju sustava e-Građani.

min čitanja

Više

Tehnologija

Seat dotjeruje Ibizu i Aronu: diskretni facelift za 2025.
Blagi redizajn donosi sitne estetske dorade, poboljšanu opremu i iste motore uoči dolaska osvježenih modela 2025.

min čitanja

Više

Tehnologija

Opatija predstavila nadograđeni GIS i 3D registar imovine
Nadograđeni Geografski informacijski sustav omogućuje 3D registar imovine, LiDAR podatke i prikaz nadzornih kamera, a uskoro stiže i karta solarnog potencijala.

min čitanja

Više

Tehnologija

OpenAI nudi nove modele „safeguard”: fleksibilnije i transparentnije čuvanje AI sigurnosti
OpenAI je pustio u opticaj dva otvoreno-težinska LLM-a koja sigurnosne politike primjenjuju u stvarnom vremenu, a stručnjaci raspravljaju hoće li to standardizirati ili suziti poimanje AI sigurnosti.

min čitanja

Više

Tehnologija

Nova Honda Prelude e:HEV donosi 184 KS i tehnologiju iz Civica Type R
Hibridni coupe vraća kultno ime, kombinira 184 KS, adaptivni ovjes i napredni Honda SENSING.

min čitanja

Više

Tehnologija

Extropicov p-bit čip izaziva status quo podatkovnih centara
Start-up iz Kalifornije razvio je čip s vjerojatnosnim bitovima i najavljuje tisućerostruku uštedu energije za umjetnu inteligenciju.

min čitanja

Više

Tehnologija

Znanstvenici tvrde da AI Claude pokazuje prve znakove samopromatranja
Studija Anthropica pokazuje da jezični model Claude ponekad može prepoznati vlastite „misli”, ali znanstvenici upozoravaju na veliku nepouzdanost takvog uvida.

min čitanja

Više

Najčitanije

Politika

Trump naredio hitan nastavak nuklearnih pokusa
Američki predsjednik nalaže Pentagonu hitan povratak podzemnim nuklearnim detonacijama, navodeći konkurenciju Rusije i Kine kao glavni motiv.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524By Пресс-служба Президента РФ - https://www.thetimes.com/world/europe/article/emmanuel-macron-rebrands-himself-as-anti-russia-hawk-to-german-fury-dlplhbbzs (indirectly, this is identical in framing, slightly different color, higher res), CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=155844791

min čitanja

Više

Nogomet

Sučićev prvijenac odveo Inter do uvjerljive pobjede nad Fiorentinom
Hrvatski reprezentativac postigao je prvi gol u dresu Intera i zaključio sjajnu večer milanskog kluba protiv Fiorentine.

min čitanja

Više

Politika

Jetten predvodi: Nizozemska na korak do prvog otvoreno homoseksualnog premijera
Izlazne ankete daju D66 laganu prednost ispred krajnje desne PVV-a, a 38-godišnji Rob Jetten mogao bi postati najmlađi i prvi otvoreno homoseksualni premijer Nizozemske.

min čitanja

Više

Najnovije

Tehnologija

Prvi hrvatski internetski dnevnik prošao četiri velike transformacije

Politika

KoHOM: Fuchsovo ograničenje ispričnica vraća lošu praksu i puni čekaonice

Vijesti

Zbog uvrede policajaca na društvenoj mreži 24-godišnjaku prijeti sud

Tehnologija

Kina u petak šalje najmlađeg astronauta i četiri miša na postaju Tiangong

Vijesti

Svaka minuta zbog vrućine odnese jedan život: nova studija upozorava na cijenu ovisnosti o fosilnim gorivima

Sport

Hajduk prošao Cibaliju nakon drame u Vinkovcima

Biznis

Privatni posrednici preuzeli carinjenje paketa: država im predaje podatke, a građanima stižu visoke naknade

Politika

Sirija priznala Kosovo, Vučić ostao bez ključnog saveznika

Vijesti

Riječka policija roditeljima: Naučite prepoznati cyberbullying i zaštitite djecu

Politika

Četiri europske skupine prijete blokadom proračuna: Von der Leyen pod sve većim pritiskom

Politika

Trump i Xi postigli trgovinski proboj u Busanu