Kineski startup Moonshot AI objavio je potpuno otvoreni model velikog jezika Kimi K2 Thinking i – prema objavljenim rezultatima – odmah zasjeo na vrh većine standardnih testova za zaključivanje, kodiranje i tzv. agentsku upotrebu alata.
Model je izgrađen kao „mixture-of-experts” sa čak jedan bilijun parametara, od kojih se pri svakom upitu aktivira 32 milijarde. Zahvaljujući toj arhitekturi i treniranju svjesnom kvantizacije (INT4 QAT) K2 Thinking može:
• održati kontekst od 256 000 tokena; • izvršiti 200–300 uzastopnih poziva alata bez nadzora; • ponuditi brzinu izvođenja dvostruko veću od modela treniranih u standardnoj preciznosti.
Ključni rezultati koje je Moonshot objavio:
– Humanity’s Last Exam: 44,9 % (rekordan skor); – BrowseComp: 60,2 % (GPT-5 postiže 54,9 %); – SWE-Bench Verified: 71,3 %; – LiveCodeBench v6: 83,1 %; – Seal-0: 56,3 %.
U agentic-web testu BrowseComp otvoreni je model nadmašio GPT-5 i Anthropicov Claude Sonnet 4.5, a u GPQA Diamond (85,7 %) tijesno je prestigao GPT-5 (84,5 %). Razliku dodatno pojačava cijena: Moonshot naplaćuje 0,15 USD za milijun ulaznih tokena (cache hit) i 2,50 USD za milijun izlaznih, dok GPT-5, prema industrijskim procjenama, stoji oko 1,25 USD odnosno 10 USD.
Licenca je modificirana MIT: slobodno komercijalno korištenje i prerade dopuštene su svima, uz jedini uvjet da se u sučelju prikaže oznaka „Kimi K2” ako proizvod prijeđe 100 milijuna mjesečnih korisnika ili 20 milijuna USD prihoda.
Rast otvorenih modela
K2 Thinking stiže samo tjedan i pol nakon što je drugi kineski model, MiniMax-M2, proglašen „novim kraljem otvorenog koda”. K2 ga je sada nadmašio na svim važnijim ljestvicama (npr. BrowseComp 60,2 % prema 44,0 %). Oba se oslanjaju na štedljivu, rijetko aktiviranu arhitekturu, no K2 aktivira trostruko više eksperata, što se pokazalo presudnim u složenim zadacima planiranja.
Šira slika: pritisak na skupe igrače
Objava dolazi u trenutku kada se sve glasnije propituje financijska održivost golemih ulaganja američkih AI divova. Financijska direktorica OpenAI-ja Sarah Friar nedavno je sugerirala da bi vlada SAD-a jednog dana mogla morati osigurati „backstop” za tvrtkine obveze, koje prelaze 1,4 bilijuna dolara. Iako je poslije pojasnila da ne traži izravnu državnu pomoć, izjava je ponovno otvorila raspravu o „AI utrci naoružanja” koju možda nije moguće dugoročno servisirati samo tržišnim novcem.
K2 Thinking pokazuje da vrhunske sposobnosti više nisu rezervirane za zatvorene sustave s gigantskim podatkovnim centrima. Tvrtke sada mogu birati između skupih, vlasničkih API-ja i besplatnih, otvorenih modela s usporedivim – ili boljim – performansama, uz potpunu kontrolu nad podacima i prilagodbom.
Za istraživačku i poslovnu zajednicu poruka je jasna: granica između otvorenog i zatvorenog „frontiera” praktički je nestala. Sljedeći korak više neće odrediti tko ima najveći klaster čipova, nego tko može najpametnije optimizirati arhitekturu i trošak.