Tehnologija

30. listopada 2025, 06:17

Nvidia predstavila NVFP4: četverobitno treniranje velikih jezičnih modela bez gubitka preciznosti

Nvidijin NVFP4 demonstrirao je da se veliki jezični modeli mogu trenirati u 4 bita bez pada točnosti, što bi moglo prepoloviti troškove memorije i ubrzati razvoj prilagođenih AI sustava.

min. čitanja

Istraživači Nvidije predstavili su NVFP4, novi način treniranja velikih jezičnih modela (LLM-ova) u svega 4 bita koji, prema vlastitim mjerenjima, postiže jednaku točnost kao u znatno većem FP8 formatu – uz dvostruko nižu potrošnju memorije i osjetno manje računalnih resursa.

Zašto je 4-bitna preciznost dosad bila problem

Kvantisacija smanjuje veličinu i trošak rada modela pretvaranjem težina iz 16- ili 32-bitnih formata u one niže preciznosti. No 4-bitni FP4 može prikazati samo 16 različitih vrijednosti, što otežava vjernu reprezentaciju podataka i često ruši točnost. Postojeći standardi, poput MXFP4, morali su birati između uštede i performansi.

Kako NVFP4 rješava ograničenja

Nvidijino rješenje uvodi višerazinsko skaliranje koje preciznije hvata ekstremne vrijednosti u podacima. Uz to, većina slojeva kvantizira se u 4 bita, dok se numerički osjetljivi dijelovi ostavljaju u BF16 formatu – taktika koju tvrtka naziva „mixed-precision strategy”. Na taj se način, navode autori, postiže „more precise and accurate representation of tensor values during training”.

Rezultati na modelu od 12 milijardi parametara

Tim je trenirao hibridni Mamba-Transformer sa 12 milijardi parametara na 10 bilijuna tokena i usporedio ga sa standardnim FP8 modelom. Krivulje gubitka i preciznosti bile su gotovo identične u cijelom procesu, a odstupanja su se pojavila tek u kasnijim fazama testova kodiranja. „This marks, to our knowledge, the first successful demonstration of training billion-parameter language models with 4-bit precision over a multi-trillion-token horizon,” pišu istraživači.

U zasebnom testu s modelom od 8 milijardi parametara NVFP4 je postigao bolji gubitak od MXFP4, dok je konkurentskom formatu trebalo 36 % više podataka da dostigne isti rezultat.

Poslovne implikacije

Direktor proizvoda za AI i podatkovne GPU-e u Nvidiji, Shar Narasimhan, ističe praktične koristi: „By training model weights directly in 4-bit format while preserving accuracy, it empowers developers to experiment with new architectures, iterate faster and uncover insights without being bottlenecked by resource constraints.” On dodaje da „NVFP4 breaks that ceiling, offering equivalent quality with dramatically greater headroom for growth and experimentation”.

Manji modeli smanjuju troškove i tijekom izvođenja, što otvara vrata složenim aplikacijama u stvarnom vremenu bez povećanja potrošnje energije. Narasimhan predviđa pomak s općih LLM-ova na „diverse ecosystem of custom, high-performance models built by a broader range of innovators”.

Što slijedi

Autori rada smatraju da NVFP4 postavlja temelj za „brže i učinkovitije treniranje budućih modela granice mogućeg”. Idući koraci uključuju dodatno istraživanje još nižih preciznosti i prilagodbi arhitektura kako bi se smanjilo opterećenje dijelova koji najviše troše računalnu snagu. Kako kaže Narasimhan, „precision can be optimized without compromising quality, and it sets the stage for a new era of intelligent, efficient AI design”.

#nvidia #shar-narasimhan #mamba

Slično

Biznis

Američki tehnološki divovi pojačavaju ulaganja u umjetnu inteligenciju unatoč bojazni od balona

Microsoft, Meta i Google objavili su rekordne prihode i najavili nove milijarde za AI infrastrukturu, dok analitičari upozoravaju na moguće pregrijavanje tržišta.

min čitanja

Više

Tehnologija

Prvi hrvatski internetski dnevnik prošao četiri velike transformacije

Istarski dnevnik, prvi hrvatski tiskani medij na internetu, prošao je četiri ključne digitalne nadogradnje od 1997. do danas.

min čitanja

Više

Tehnologija

Kina u petak šalje najmlađeg astronauta i četiri miša na postaju Tiangong

Misija Shenzhou-21 kreće u petak navečer; 32-godišnji Wu Fei bit će najmlađi Kinez u svemiru, a na Tiangong stižu i prvi kineski orbitalni pokusi na miševima.

min čitanja

Više

Tehnologija

Split otvara besplatnu akademiju za e-Građane

Grad i Tehnološki park Split pokreću besplatan program koji građane uči korištenju sustava e-Građani.

min čitanja

Više

Tehnologija

Seat dotjeruje Ibizu i Aronu: diskretni facelift za 2025.

Blagi redizajn donosi sitne estetske dorade, poboljšanu opremu i iste motore uoči dolaska osvježenih modela 2025.

min čitanja

Više

Tehnologija

Opatija predstavila nadograđeni GIS i 3D registar imovine

Nadograđeni Geografski informacijski sustav omogućuje 3D registar imovine, LiDAR podatke i prikaz nadzornih kamera, a uskoro stiže i karta solarnog potencijala.

min čitanja

Više

Tehnologija

OpenAI nudi nove modele „safeguard”: fleksibilnije i transparentnije čuvanje AI sigurnosti

OpenAI je pustio u opticaj dva otvoreno-težinska LLM-a koja sigurnosne politike primjenjuju u stvarnom vremenu, a stručnjaci raspravljaju hoće li to standardizirati ili suziti poimanje AI sigurnosti.

min čitanja

Više

Tehnologija

Nova Honda Prelude e:HEV donosi 184 KS i tehnologiju iz Civica Type R

Hibridni coupe vraća kultno ime, kombinira 184 KS, adaptivni ovjes i napredni Honda SENSING.

min čitanja

Više

Tehnologija

Extropicov p-bit čip izaziva status quo podatkovnih centara

Start-up iz Kalifornije razvio je čip s vjerojatnosnim bitovima i najavljuje tisućerostruku uštedu energije za umjetnu inteligenciju.

min čitanja

Više

Tehnologija

Znanstvenici tvrde da AI Claude pokazuje prve znakove samopromatranja

Studija Anthropica pokazuje da jezični model Claude ponekad može prepoznati vlastite „misli”, ali znanstvenici upozoravaju na veliku nepouzdanost takvog uvida.

min čitanja

Više

Tehnologija

30. listopada 2025, 06:17

Nvidia predstavila NVFP4: četverobitno treniranje velikih jezičnih modela bez gubitka preciznosti

Nvidijin NVFP4 demonstrirao je da se veliki jezični modeli mogu trenirati u 4 bita bez pada točnosti, što bi moglo prepoloviti troškove memorije i ubrzati razvoj prilagođenih AI sustava.

min. čitanja

Zašto je 4-bitna preciznost dosad bila problem

Kako NVFP4 rješava ograničenja

Rezultati na modelu od 12 milijardi parametara

U zasebnom testu s modelom od 8 milijardi parametara NVFP4 je postigao bolji gubitak od MXFP4, dok je konkurentskom formatu trebalo 36 % više podataka da dostigne isti rezultat.

Poslovne implikacije

Što slijedi

#nvidia #shar-narasimhan #mamba

Slično

Biznis

Američki tehnološki divovi pojačavaju ulaganja u umjetnu inteligenciju unatoč bojazni od balona

Microsoft, Meta i Google objavili su rekordne prihode i najavili nove milijarde za AI infrastrukturu, dok analitičari upozoravaju na moguće pregrijavanje tržišta.

min čitanja

Više

Tehnologija

Prvi hrvatski internetski dnevnik prošao četiri velike transformacije

Istarski dnevnik, prvi hrvatski tiskani medij na internetu, prošao je četiri ključne digitalne nadogradnje od 1997. do danas.

min čitanja

Više

Tehnologija

Kina u petak šalje najmlađeg astronauta i četiri miša na postaju Tiangong

Misija Shenzhou-21 kreće u petak navečer; 32-godišnji Wu Fei bit će najmlađi Kinez u svemiru, a na Tiangong stižu i prvi kineski orbitalni pokusi na miševima.

min čitanja

Više

Tehnologija

Split otvara besplatnu akademiju za e-Građane

Grad i Tehnološki park Split pokreću besplatan program koji građane uči korištenju sustava e-Građani.

min čitanja

Više

Tehnologija

Seat dotjeruje Ibizu i Aronu: diskretni facelift za 2025.

Blagi redizajn donosi sitne estetske dorade, poboljšanu opremu i iste motore uoči dolaska osvježenih modela 2025.

min čitanja

Više

Tehnologija

Opatija predstavila nadograđeni GIS i 3D registar imovine

Nadograđeni Geografski informacijski sustav omogućuje 3D registar imovine, LiDAR podatke i prikaz nadzornih kamera, a uskoro stiže i karta solarnog potencijala.

min čitanja

Više

Tehnologija

OpenAI nudi nove modele „safeguard”: fleksibilnije i transparentnije čuvanje AI sigurnosti

min čitanja

Više

Tehnologija

Nova Honda Prelude e:HEV donosi 184 KS i tehnologiju iz Civica Type R

Hibridni coupe vraća kultno ime, kombinira 184 KS, adaptivni ovjes i napredni Honda SENSING.

min čitanja

Više

Tehnologija

Extropicov p-bit čip izaziva status quo podatkovnih centara

Start-up iz Kalifornije razvio je čip s vjerojatnosnim bitovima i najavljuje tisućerostruku uštedu energije za umjetnu inteligenciju.

min čitanja

Više

Tehnologija

Znanstvenici tvrde da AI Claude pokazuje prve znakove samopromatranja

Studija Anthropica pokazuje da jezični model Claude ponekad može prepoznati vlastite „misli”, ali znanstvenici upozoravaju na veliku nepouzdanost takvog uvida.

min čitanja

Više