Kineski startup Moonshot AI otvorio je u petak kod novog jezičnog modela Kimi K2 i time izravno napao dominaciju OpenAI-ja i Anthropic-a.
• Arhitektura: mješavina stručnjaka s ukupno 1 bilijun parametara i 32 milijarde „aktivnih” parametara. • Verzije: temeljni model za istraživače te Kimi K2-Instruct prilagođen razgovoru i autonomnim agentima. • Cijena API-ja: 0,15 USD za milijun ulaznih tokena (cache hit) i 2,50 USD za milijun izlaznih – osjetno niže od vodećih konkurenata.
Rezultati testiranja
– SWE-bench Verified: 65,8 % točnosti, iznad većine otvorenih i dijela vlasničkih sustava. – LiveCodeBench: 53,7 %, bolje od DeepSeek-a V3 (46,9 %) i GPT-4.1 (44,7 %). – MATH-500: 97,4 % naspram GPT-4.1-ovih 92,4 %.
Tvrtka tvrdi da je ključ uspjeha optimizacija za takozvane „agentske” zadatke – model autonomno bira alate, piše i izvršava kod te obavlja složene višekoračne procese bez nadzora čovjeka.
„Kimi K2 ne odgovara samo na pitanja; on djeluje”, poručili su iz Moonshota u objavi lansiranja.
Tehnički iskorak: MuonClip
U dokumentaciji se ističe novi optimizator MuonClip koji, prema Moonshotu, omogućuje stabilno treniranje modela od bilijun parametara „bez ikakve nestabilnosti”. Metoda smanjuje eksploziju pažnje reskaliranjem težina u query i key projekcijama, što značajno skraćuje i pojeftinjuje treniranje.
Strategija dvostruke ponude
Otvaranjem koda i istodobnom prodajom pristupa kroz API Moonshot računa na efekt „muhe u staklenci”: programeri besplatno testiraju model, a korporacije kasnije plaćaju premijske usluge ili ga samostalno hostaju radi usklađenosti i smanjenja troškova. Konkurenti time bivaju prisiljeni birati između rezanja marži i gubitka korisnika.
Prvi prikazi primjene
Demonstracije na društvenim mrežama prikazuju Kimi K2 kako samostalno izvodi 16 Python operacija za analizu plaća ili koordinira 17 poziva različitim servisima pri planiranju koncerta u Londonu – od pretrage do rezervacije smještaja.
Za razliku od generativnih chatbota fokusiranih na razgovor, Kimi K2 stavlja naglasak na isporuku rezultata. Taj pomak mogao bi biti presudan za poslovne korisnike kojima treba produktivnost, a ne impresija Turingova testa.
Širi učinak
Analitičari ocjenjuju da objava označava trenutak u kojem se otvoreni modeli po širini sposobnosti izjednačavaju s vlasničkima. Pritom Moonshot nudi niže cijene i fleksibilnije opcije implementacije, čime dodatno pritišće već skupe operacije OpenAI-ja i Anthropic-a.
Ako se MuonClip pokaže univerzalnim, trošak treniranja velikih modela mogao bi dramatično pasti, a utrka u skaliranju dobiti novo poglavlje – ono u kojem manji, agilniji igrači ruše barijere koje su donedavno činile monopol tehnoloških divova.