Nvidia je objavio novu, kompaktnu jezičnu umjetnu inteligenciju Nemotron-Nano-9B-v2, koja prema internim testovima ostvaruje vrhunske rezultate u klasi i donosi neuobičajenu mogućnost uključivanja ili isključivanja vlastitog „razmišljanja” prije davanja odgovora.
Model s 9 milijardi parametara – smanjen s izvornih 12 milijardi kako bi stao na popularni GPU A10 – predstavlja hibridnu arhitekturu koja kombinira Transformer i Mamba slojeve. Taj pristup, ističe Nvidia, omogućuje do šest puta brže izvođenje i 2–3 puta veći protok podataka pri dugim kontekstima u odnosu na usporedive modele.
Ključne značajke • Podržani jezici: engleski, njemački, španjolski, francuski, talijanski, japanski te, u proširenom opisu, korejski, portugalski, ruski i kineski. • Dvostruka namjena: slijedenje uputa i generiranje programskog koda. • Prekidač /think ili /no_think omogućuje korisniku da odluči hoće li se AI najprije „posavjetovati sa sobom” – uz mogućnost definiranja maksimalnog broja tokena za interno rezoniranje, čime se balansiraju točnost i brzina.
Rezultati testiranja U „razmišljanje uključenom” načinu Nano-9B-v2 postiže 72,1 % na AIME25, 97,8 % na MATH500, 64,0 % na GPQA i 71,1 % na LiveCodeBenchu. Na testovima praćenja uputa model doseže 90,3 % (IFEval), dok na zahtjevnom RULER 128K testu za dugi kontekst bilježi 78,9 %. U usporedbi s često spominjanim Qwen3-8B, Nvidia navodi osjetno bolju preciznost u cijelom rasponu.
Podaci i licenca Nemotron-Nano-9B-v2 treniran je na mješavini probranih internetskih tekstova, koda, matematičkih i pravnih dokumenata te sintetičkih skupova pitanja-odgovora koje su generirali veći modeli. Dostupan je za preuzimanje putem Hugging Facea i Nvidia Model Cataloga pod Nvidia Open Model License Agreementom (lipanj 2025.), koji dopušta besplatnu komercijalnu uporabu uz obvezu očuvanja ugrađenih zaštitnih mehanizama, poštovanje izvoznih propisa i navođenje izvora: „Licensed by Nvidia Corporation under the Nvidia Open Model License”.
Pozicioniranje Objavom Nemotron-Nano-9B-v2 Nvidia cilja razvojne timove kojima je potrebna kombinacija razumne računalne ekonomičnosti i naprednog rezoniranja. Kontrola „budžeta razmišljanja” i mogućnost potpunog isključenja internih razrada trebale bi olakšati prilagodbu točnosti i latentnosti u rješenjima poput chatbotova, korisničke podrške ili autonomnih agenata.
U eri u kojoj se troškovi pokretanja velikih LLM-ova penju, Nvidia novim Nano modelom pokazuje smjer prema učinkovitijim, a ipak moćnim rješenjima spremnima za brzu integraciju u poslovne sustave.