Nvidia je objavila Nemotron 3 Super, novi jezični model od 120 milijardi parametara koji cilja izravno na najzahtjevnije potrebe poslovnih korisnika.
Glavni izazov koji proizvođači ističu jest eksplozija troškova kod višestrukih AI-agenata: složeni sustavi za, primjerice, razvoj softvera ili kibernetičku sigurnost mogu proizvesti i do 15 puta više tokena od uobičajenog chat-razgovora, pa tako i višestruko poskupjeti obradu podataka.
Nemotron 3 Super pokušava zadržati dubinu rezoniranja potrebnu za takve „agentne“ radne tokove, ali bez gomilanja računalnih resursa tipičnih za klasične, gusto povezane modele. Ključne novosti:
- hibridna arhitektura koja spaja state-space modele, transformatore i novi „Latent“ sustav mixture-of-experts,
- otvorene težine objavljene na platformi Hugging Face, uz dozvolu za komercijalnu primjenu,
- fokus na dugoročne zadatke u području softverskog inženjeringa, analize koda i korporativne kibernetičke zaštite.
Objavljivanjem modela pod pretežno otvorenom licencom Nvidia nastavlja strategiju približavanja vrhunskih AI-alata širem poslovnom tržištu. Tvrtka tvrdi da će upravo optimizirani omjer računalne potrošnje i sposobnosti vođenja „dugih“ razgovora činiti razliku u okruženjima u kojima se istodobno izvršava više nezavisnih agenata.
Nemotron 3 Super već je dostupan za preuzimanje, a tehnička zajednica počela je ispitivati koliko će ovaj pristup uistinu smanjiti troškove i ubrzati razvoj složenih AI sustava u praksi.