Tehnologija

MiniMax-M1 donosi otvorenu AI revoluciju s milijun tokena konteksta

MiniMax lansirao M1, otvoreni LLM s milijunskim kontekstom i rekordno niskim troškom treniranja.

min čitanja

Kineski startup MiniMax iznenadio je tehnološku zajednicu objavom MiniMax-M1, otvorenog modela velikog jezika (LLM) pod licencijom Apache 2.0. Model je već dostupan na Hugging Faceu i GitHubu te se može besplatno prilagođavati i koristiti u komercijalnim rješenjima.

Najveće prednosti

• Kontekstni prozor od 1 000 000 tokena i do 80 000 tokena izlaza, što višestruko nadmašuje GPT-4o (128 000) i izjednačava se s Googleovim Gemini 2.5 Pro. • Dvije varijante: M1-40k i M1-80k, nazvane po maksimalnoj „budžetu razmišljanja” odnosno duljini generiranog teksta. • Hibridna arhitektura Mixture-of-Experts s „lightning attentionom” smanjuje troškove izvođenja; na duljini od 100 000 tokena traži tek 25 % FLOP-ova potrebnih DeepSeeku R1. • Trening je koštao samo 534 700 USD, zahvaljujući vlastitom RL algoritmu CISPO koji skraćuje procese važnog uzorkovanja. • Struktura s 456 milijardi parametara (45,9 milijardi aktivnih po tokenu).

Rezultati na testovima

– AIME 2024 (matematika): 86,0 % – LiveCodeBench (kod): 65,0 % – SWE-bench Verified: 56,0 % – TAU-bench: 62,8 % – OpenAI MRCR (4-needle): 73,4 %

M1 prema tim brojkama prestiže otvorene konkurente DeepSeek-R1 i Qwen3-235B-A22B, dok zatvoreni modeli poput GPT-4o i Geminija još uvijek vode na pojedinim ljestvicama.

Što donosi tvrtkama

• Znatno niže operativne troškove zbog manje potrošnje hardverskih resursa. • Obrada vrlo dugih dokumenata bez prethodnog rezanja ili segmentiranja. • Mogućnost lokalne, sigurnije implementacije bez slanja podataka trećim stranama. • Lakšu integraciju kroz preporučeni backend vLLM ili biblioteku Transformers. • Ugrađeni API za razgovorni bot s funkcijama internetskog pretraživanja, generiranja videa i slika, sinteze govora i kloniranja glasa.

Objava M1-ice prva je u sklopu najavljenog „MiniMaxWeeka”, pa se idućih dana očekuju dodatne novosti iz tvrtke koja očito cilja na kombinaciju otvorenosti, dugog konteksta i ekstremne učinkovitosti kao recept za sljedeću generaciju AI aplikacija.

Slično

Groq cilja AWS i Google: brže izvođenje modela uz partnerstvo s Hugging Faceom
Start-up Groq uvodi podršku za 131 000 tokena u Qwen3 32B modelu i postaje službeni inference-provider na Hugging Faceu, najavljujući izazov AWS-u i Googleu.

min čitanja

Više

Google stavlja generativni AI u džep: AI Edge Gallery radi bez interneta
Googleova eksperimentalna aplikacija AI Edge Gallery omogućuje pokretanje naprednih AI modela izravno na Android telefonima bez internetske veze, stavljajući naglasak na privatnost, ali i otvarajući nova sigurnosna pitanja.

min čitanja

Više

Ostalo

Katamaran Melita tonuo kod Zadra, 43 osobe evakuirane na trajekt
Svi putnici i članovi posade katamarana Melita spašeni su nakon večernje havarije u zadarskom kanalu.

min čitanja

Više

Bruxelles stišće papučicu: nova pravila ubrzavaju GDPR postupke protiv tehnoloških divova
EU je dogovorila nova proceduralna pravila koja bi trebala ubrzati prekogranične GDPR istrage, posebice protiv tehnoloških divova. Aktivisti i industrija kritiziraju kompromis, dok ga pregovarači Bruxellesa predstavljaju kao rezanje birokracije.

min čitanja

Više

Kemijski GPS u aksolotlu otkriva tajnu regeneracije udova
Istraživači su pokazali da razgradnja retinoične kiseline, a ne njezina proizvodnja, određuje koje će dijelove uda aksolotl obnoviti, otkrivši pritom i ključni gen Shox.

min čitanja

Više

Facebook kupio Oculus Rift za 2 milijarde dolara
Kako je Oculus od startupa došao do Facebookove akvizicije vrijedne 2 milijarde dolara i pritom se suočio s vječnim problemom mučnine u virtualnoj stvarnosti.

min čitanja

Više

Ubojstvo na Markuševcu: Uhićen vojnik Počasno-zaštitne bojne
Jedan od dvojice uhićenih zbog dvostrukog ubojstva na Markuševcu jest aktivni pripadnik Oružanih snaga, potvrdio je MORH.

min čitanja

Više

G7 ublažio retoriku o sigurnosti umjetne inteligencije
Na summitu u Kanadi čelnici G7 ublažili su retoriku o rizicima umjetne inteligencije, stavivši naglasak na gospodarski rast i bržu primjenu tehnologije.

min čitanja

Više

LinkedIn uvodi pretraživanje poslova potpomognuto umjetnom inteligencijom
Društvena mreža za profesionalce pokrenula je AI sustav koji razumije prirodni jezik i eliminira frustracije oko ključnih riječi pri potrazi za poslom.

min čitanja

Više

Apple za film F1 razvio posebnu mini kameru na bazi iPhonea
Apple je preradio iPhone kameru u posebni modul kako bi redatelju Josepu Kosinskom omogućio autentične kadrove iz kokpita bolida za film „F1”.

min čitanja

Više

1Password i AWS sklopili strateški savez za sigurniji oblak s umjetnom inteligencijom
Strateški sporazum 1Passworda i AWS-a cilja zatvoriti sigurnosni jaz nastao masovnom upotrebom AI alata i neodobrenih aplikacija u hibridnom radu.

min čitanja

Više