Kineski startup MiniMax iz Šangaja objavio je novu generaciju svojega velikog jezičnog modela M2.5 u dvjema varijantama – Standard i M2.5-Lightning – uz tvrdnju da smanjuje cijenu rada umjetne inteligencije i do 95 % u odnosu na najskuplje konkurente.
Prema podacima tvrtke, M2.5 se u njezinu dnevnom radu već koristi za 30 % svih zadataka, dok „zapanjujućih 80 %“ novo napisanog koda generira upravo ovaj model. Time MiniMax signalizira pomak s koncepta AI-chatbota na AI-radnika: umjesto da se inteligencija mjeri svakim potrošenim tokenom, tvrtka najavljuje eru autonomnih agenata koji satima mogu programirati, istraživati i organizirati složene projekte bez golemih troškova.
Ključ učinkovitosti skriva se u Mixture of Experts (MoE) arhitekturi. Iako M2.5 nominalno sadrži 230 milijardi parametara, pri svakoj generaciji teksta „budi“ se samo oko 10 milijardi, što zadržava dubinu rezoniranja velikog modela uz brzinu i potrošnju mnogo manjeg sustava.
MiniMax tvrdi da je time postigao „near state-of-the-art“ performanse, a cijenu smanjio do te mjere da, kako kažu, nestaje potreba za minutnim optimiranjem promptova. Tvrtka cilja na primjene u financijama, pravu i društvenim znanostima, gdje se očekuje da modeli visoke kontekstualne i logičke sposobnosti postanu rutina.
Model dolazi kroz API, a obje verzije namijenjene su masovnoj produkciji. Iako MiniMax govori o „otvorenom kodu“, težine i licenca još nisu objavljene.
Usporedi li se s visokoprofiliranim sustavima poput GPT-5 ili Claude 4.6 Opus, MiniMaxova ponuda predstavlja izravni izazov: pružiti vrhunsku inteligenciju po cijeni koja, barem prema navodima tvrtke, postaje „suviše niska da bi se mjerila“. Ako se najave potvrde u praksi, tržište generativne umjetne inteligencije moglo bi doživjeti najradikalnije snižavanje cijena dosad.