Alibaba je neposredno uoči lunarne nove godine lansirao svoju novu perjanicu među otvorenim velikim jezičnim modelima – Qwen 3.5-397B-A17B. Iako model ukupno sadrži 397 milijardi parametara, u svakom koraku aktivira tek 17 milijardi, čime postiže omjer snage i efikasnosti koji bi, kako poručuju iz Alibabe, trebao natjerati poduzeća da razmisle o prelasku s iznajmljivanja AI-usluga na vlastito upravljanje modelima.
Glavne novosti i brojke:
• Skok u arhitekturi: nasljednik eksperimentalnog Qwen 3-Next povećao je broj „stručnjaka” u Mixture-of-Experts sustavu sa 128 na 512, omogućujući veću specijalizaciju bez rasta aktivnih parametara.
• Ušteda troškova: prema Alibabi, Qwen 3.5 je 60 % jeftiniji za izvođenje od prethodnog modela Qwen 3-Max, a istovremeno može podržati osam puta više paralelnih zahtjeva.
• Višestruko predviđanje tokena i poboljšani sustav pozornosti, preuzeti iz Qwen 3-Next, smanjuju potrošnju memorije i povećavaju maksimalnu duljinu konteksta.
• Širenje jezika: model sada nudi potporu za 201 jezik i dijalekt, ciljajući globalne implementacije u tvrtkama koje posluju na više tržišta.
Qwen 3-Max, prethodna unutarnja zvijezda Alibabe, prema internim podacima prelazio je granicu od bilijun parametara, no novi model unatoč manjem ukupnom opsegu u ključnim referentnim testovima nadmašuje svog starijeg brata. Za IT direktore koji planiraju infrastrukturu za 2026. godinu poruka je jasna: „model koji možete pokrenuti, posjedovati i kontrolirati” više ne mora zaostajati za onima koje je moguće samo unajmiti putem API-ja.
Objava Qwena 3.5 uklapa se u širi tržišni pomak prema otvorenim, prilagodljivim rješenjima koja nude visoke performanse bez zaključavanja na tuđu infrastrukturu. Ako se najavljena ušteda i skalabilnost pokažu točnima u stvarnoj primjeni, konkurencija u korporativnom AI-u ući će u novu, znatno povoljniju fazu za krajnje korisnike.