Izumitelji tranzistora govorili su o urednoj eksponencijalnoj krivulji: svake godine sve dvostruko brže, jeftinije i snažnije. No, razvoj računalstva dosad se pokazivao više poput piramide – niz ravnih plato-a koje povremeno prekine strma stepenica. Dok su se nekad procesorski (CPU) giganti borili za još nekoliko megaherca, grafički procesori (GPU) preuzeli su štafetu i pogurali eksploziju generativne umjetne inteligencije. Sada se, tvrde analitičari, ponovno nazire prijelomni korak – i to u sferi inferencije, odnosno samog „razmišljanja” modela.
-
DeepSeek pokazao da se može jeftinije Krajem 2024. kineski laboratorij DeepSeek uspio je istrenirati vrhunski veliki jezični model s iznenađujuće skromnim budžetom. Ključ je bio u MoE-u (mixture-of-experts), tehnici koja aktivira samo dio neuronske mreže i tako drastično reže troškove. Istu je metodu Nvidia nedavno istaknula u najavi svoje sljedeće Rubin platforme, uz obećanje „do 10 puta niže cijene po tokenu”.
-
Groq rješava problem čekanja Dok trening zahtijeva sirovu paralelnu snagu, inteligentniji „System 2” modeli trebaju brzinu sekvencijskog procesiranja kako bi u realnom vremenu stvarali i provjeravali tisuće internih „thought tokena”. Na klasičnom GPU-u to može potrajati i pola minute; Groqova LPU arhitektura, oslobođena uskog grla memorijske propusnosti, istu količinu posla obavi za manje od dvije sekunde. Time otklanja najneugodniju manu današnjih AI asistenata – zastoj prije odgovora.
-
Potencijalni savez s Nvidijom Špekulira se da bi Nvidia mogla prigrliti Groq kako bi zadržala primat i u fazi inferencije. Tvrtka već posjeduje neusporediv softverski ekosustav (CUDA); spajanje s Groqovim hardverom izgradilo bi „rov toliko širok da ga konkurencija ne može preskočiti”. U praksi bi ista platforma nudila najbolji teren za treniranje i najbrži pogon za izvođenje modela.
-
Šira slika Predsjednik Anthropica Dario Amodei ranije je upozorio: „Eksponencijala traje dok ne stane.” Upravo zato industrija stalno traži iduću stepenicu. Ako se brzina Groqa spoji s učinkovitijim otvorenim modelima poput budućeg DeepSeeka 4, korisnici bi dobili inteligenciju usporedivu s današnjim komercijalnim gigantima – ali uz znatno nižu cijenu i gotovo trenutačan odziv.
Zaključak Od prvih tranzistora do današnjih LPU-ova svaki je plato trajao dok se nije pojavio novi arhitektonski zaokret. Groq i DeepSeek pokazuju da je sljedeća stepenica već nadohvat ruke, a odluka Nvidije hoće li je zakoračiti mogla bi odrediti ritam čitave AI industrije.