CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

6. studenog 2025, 20:03

Kineski Kimi K2 Thinking prestiže GPT-5 i otvara novu bitku za AI

Otvoreni kineski model Kimi K2 Thinking nadmašio je GPT-5 u ključnim testovima, uz višestruko nižu cijenu, što pojačava pritisak na američke AI divove i njihova skupa ulaganja.

min. čitanja

XFacebookWhatsApp

Kineski startup Moonshot AI objavio je potpuno otvoreni model velikog jezika Kimi K2 Thinking i – prema objavljenim rezultatima – odmah zasjeo na vrh većine standardnih testova za zaključivanje, kodiranje i tzv. agentsku upotrebu alata.

Model je izgrađen kao „mixture-of-experts” sa čak jedan bilijun parametara, od kojih se pri svakom upitu aktivira 32 milijarde. Zahvaljujući toj arhitekturi i treniranju svjesnom kvantizacije (INT4 QAT) K2 Thinking može:

• održati kontekst od 256 000 tokena; • izvršiti 200–300 uzastopnih poziva alata bez nadzora; • ponuditi brzinu izvođenja dvostruko veću od modela treniranih u standardnoj preciznosti.

Ključni rezultati koje je Moonshot objavio:

– Humanity’s Last Exam: 44,9 % (rekordan skor); – BrowseComp: 60,2 % (GPT-5 postiže 54,9 %); – SWE-Bench Verified: 71,3 %; – LiveCodeBench v6: 83,1 %; – Seal-0: 56,3 %.

U agentic-web testu BrowseComp otvoreni je model nadmašio GPT-5 i Anthropicov Claude Sonnet 4.5, a u GPQA Diamond (85,7 %) tijesno je prestigao GPT-5 (84,5 %). Razliku dodatno pojačava cijena: Moonshot naplaćuje 0,15 USD za milijun ulaznih tokena (cache hit) i 2,50 USD za milijun izlaznih, dok GPT-5, prema industrijskim procjenama, stoji oko 1,25 USD odnosno 10 USD.

Licenca je modificirana MIT: slobodno komercijalno korištenje i prerade dopuštene su svima, uz jedini uvjet da se u sučelju prikaže oznaka „Kimi K2” ako proizvod prijeđe 100 milijuna mjesečnih korisnika ili 20 milijuna USD prihoda.

Rast otvorenih modela

K2 Thinking stiže samo tjedan i pol nakon što je drugi kineski model, MiniMax-M2, proglašen „novim kraljem otvorenog koda”. K2 ga je sada nadmašio na svim važnijim ljestvicama (npr. BrowseComp 60,2 % prema 44,0 %). Oba se oslanjaju na štedljivu, rijetko aktiviranu arhitekturu, no K2 aktivira trostruko više eksperata, što se pokazalo presudnim u složenim zadacima planiranja.

Šira slika: pritisak na skupe igrače

Objava dolazi u trenutku kada se sve glasnije propituje financijska održivost golemih ulaganja američkih AI divova. Financijska direktorica OpenAI-ja Sarah Friar nedavno je sugerirala da bi vlada SAD-a jednog dana mogla morati osigurati „backstop” za tvrtkine obveze, koje prelaze 1,4 bilijuna dolara. Iako je poslije pojasnila da ne traži izravnu državnu pomoć, izjava je ponovno otvorila raspravu o „AI utrci naoružanja” koju možda nije moguće dugoročno servisirati samo tržišnim novcem.

K2 Thinking pokazuje da vrhunske sposobnosti više nisu rezervirane za zatvorene sustave s gigantskim podatkovnim centrima. Tvrtke sada mogu birati između skupih, vlasničkih API-ja i besplatnih, otvorenih modela s usporedivim – ili boljim – performansama, uz potpunu kontrolu nad podacima i prilagodbom.

Za istraživačku i poslovnu zajednicu poruka je jasna: granica između otvorenog i zatvorenog „frontiera” praktički je nestala. Sljedeći korak više neće odrediti tko ima najveći klaster čipova, nego tko može najpametnije optimizirati arhitekturu i trošak.

#openai#moonshot-ai#kimi-k2#browsecomp#sarah-friar

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

OpenAI unutar kuće stvorio podatkovnog agenta koji zaposlenicima štedi sate rada
Interni AI agent na GPT-u zaposlenicima OpenAI-ja dostupnim je u Slacku i drugim alatima te im u minutama isporučuje analize koje su prije tražile sate rada.

min čitanja

Više

Tehnologija

Alibaba lansirao seriju Qwen3.5: kompaktni AI modeli ciljaju mobilne uređaje
Alibaba je predstavio četiri nova otvorena AI modela Qwen3.5, namijenjena štedljivim uređajima i složenom rezoniranju, čime kineska tvrtka pojačava konkurenciju u globalnoj utrci umjetne inteligencije.

min čitanja

Više

Tehnologija

Pentagon koristio Claude u napadu na Iran unatoč Trumpovoj zabrani
Američka vojska oslanjala se na AI sustav Claude prilikom zračnih udara na Iran iako je Donald Trump nekoliko sati ranije izdao naredbu o prekidu suradnje s tvrtkom Anthropic.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Munjeviti napad na Iran otkrio tamnu stranu ratne umjetne inteligencije
Američko-izraelski napad na Iran prvi je veliki sukob u kojem su sustavi umjetne inteligencije vodili tempo udara, otvarajući ozbiljna etička pitanja o budućnosti ratovanja.

min čitanja

Više

Tehnologija

Endor Labs predstavlja AURI: besplatni alat koji ugrađuje sigurnost u AI kodiranje
Sigurnosni start-up Endor Labs lansirao je AURI, platformu koja u stvarnom vremenu prati AI generirani kod i besplatno je dostupna pojedinačnim programerima.

min čitanja

Više

Tehnologija

Povratak Jolle: finski „europski telefon” izaziva američki duopol
Jolla na MWC-u 2026. otkrila detalje o novom Jolla Phoneu: uređaj proizveden u Finskoj, pokretan Sailfish OS-om i s više od 10 000 prednarudžbi, predstavlja se kao europska alternativa američkim platformama.

min čitanja

Više

Tehnologija

Spektakl na nebu: krvavi Mjesec obojit će noć, ali Hrvatska ostaje uskraćena
Totalna pomrčina Mjeseca pretvorit će ga u crveni disk vidljiv iz Amerike, Australije i Azije, dok će Europa ostati u sjeni.

min čitanja

Više

Tehnologija

Deutsche Telekom predstavio „Magenta AI Call Assistant” za pozive
Na MWC-u u Barceloni Deutsche Telekom i ElevenLabs otkrili su AI pomoćnika koji unutar običnog telefonskog poziva nudi prijevod uživo i druge pametne funkcije.

min čitanja

Više

Tehnologija

Apple predstavlja iPhone 17e po nižoj cijeni i s dvostrukom memorijom
Novi iPhone 17e nudi 256 GB pohrane za 599 dolara, što analitičari vide kao prikriveno sniženje cijene u jeku rasta cijena čipova.

min čitanja

Više

Tehnologija

Mini FabLab u Puli pretvara ideje u stvarnost
Interaktivno događanje u Centru za mlade Pula približava 3D tehnologiju i STEM područje djeci i mladima.

min čitanja

Više

Najčitanije

Politika

Sindikati 18. travnja u Zagrebu najavljuju masovni prosvjed za veće plaće i mirovine
Najveće sindikalne središnjice i umirovljenički sindikat 18. travnja organiziraju prosvjed u središtu Zagreba, tražeći veće plaće i pravednije mirovine.

min čitanja

Više

Biznis

Inflacija se vraća na 3,8 % – Hrvatska druga najskuplja u eurozoni
Godišnja stopa inflacije u veljači skočila je na 3,8 %, a samo je Slovačka imala višu cijenu života u eurozoni.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Skijanje

Hrvatski parasportaši stigli u Cortinu i s nestrpljenjem čekaju početak ZPOI
Pet hrvatskih parasportaša smjestilo se u privremenom paraolimpijskom selu u Cortini d’Ampezzo i spremno dočekuje 14. Zimske paraolimpijske igre koje počinju 6. ožujka.

min čitanja

Više

Najnovije

Lifestyle

Riječka publika 5. ožujka upoznaje novu „Mirandolinu”

Vijesti

Istarska županija izdala vodič za ponašanje u krizama

Sport

Rabljani izvukli arbuna od 1,6 kilograma s obale

Sport

Marko Rog pojačao Lokomotivu: bivši Vatreni vraća se u HNL

Politika

Županija okuplja općine: zajednički sporazum za hrvatsku djecu u Vojvodini i povoljnije toplice za umirovljenike

Vijesti

Gospić kreće u prvu fazu sanacije: 3.500 tona opasnog otpada ide na sigurno zbrinjavanje

Lifestyle

Dubravka Lošić donosi „Potaknutu strahom i ljepotom” na Venecijanski bijenale

Sport

Fedor osporio Cro Copov moždani udar i najavio borbu u lipnju

Politika

Plakati u Rijeci napali američki i izraelski imperializam

Politika

HDZ optužio Ivanu Kekin za politizaciju škola, ona uzvraća da je govorila kao liječnica

Vijesti

Škurinje u srijedu bez grijanja zbog radova u toplani