Alibaba predstavio Qwen 3.5: otvoreni AI div od 397 milijardi parametara

Alibaba je neposredno uoči lunarne nove godine lansirao svoju novu perjanicu među otvorenim velikim jezičnim modelima – Qwen 3.5-397B-A17B. Iako model ukupno sadrži 397 milijardi parametara, u svakom koraku aktivira tek 17 milijardi, čime postiže omjer snage i efikasnosti koji bi, kako poručuju iz Alibabe, trebao natjerati poduzeća da razmisle o prelasku s iznajmljivanja AI-usluga na vlastito upravljanje modelima.

Glavne novosti i brojke:

• Skok u arhitekturi: nasljednik eksperimentalnog Qwen 3-Next povećao je broj „stručnjaka” u Mixture-of-Experts sustavu sa 128 na 512, omogućujući veću specijalizaciju bez rasta aktivnih parametara.

• Ušteda troškova: prema Alibabi, Qwen 3.5 je 60 % jeftiniji za izvođenje od prethodnog modela Qwen 3-Max, a istovremeno može podržati osam puta više paralelnih zahtjeva.

• Višestruko predviđanje tokena i poboljšani sustav pozornosti, preuzeti iz Qwen 3-Next, smanjuju potrošnju memorije i povećavaju maksimalnu duljinu konteksta.

• Širenje jezika: model sada nudi potporu za 201 jezik i dijalekt, ciljajući globalne implementacije u tvrtkama koje posluju na više tržišta.

Qwen 3-Max, prethodna unutarnja zvijezda Alibabe, prema internim podacima prelazio je granicu od bilijun parametara, no novi model unatoč manjem ukupnom opsegu u ključnim referentnim testovima nadmašuje svog starijeg brata. Za IT direktore koji planiraju infrastrukturu za 2026. godinu poruka je jasna: „model koji možete pokrenuti, posjedovati i kontrolirati” više ne mora zaostajati za onima koje je moguće samo unajmiti putem API-ja.

Objava Qwena 3.5 uklapa se u širi tržišni pomak prema otvorenim, prilagodljivim rješenjima koja nude visoke performanse bez zaključavanja na tuđu infrastrukturu. Ako se najavljena ušteda i skalabilnost pokažu točnima u stvarnoj primjeni, konkurencija u korporativnom AI-u ući će u novu, znatno povoljniju fazu za krajnje korisnike.

Glavne novosti i brojke:

• Ušteda troškova: prema Alibabi, Qwen 3.5 je 60 % jeftiniji za izvođenje od prethodnog modela Qwen 3-Max, a istovremeno može podržati osam puta više paralelnih zahtjeva.

• Višestruko predviđanje tokena i poboljšani sustav pozornosti, preuzeti iz Qwen 3-Next, smanjuju potrošnju memorije i povećavaju maksimalnu duljinu konteksta.

• Širenje jezika: model sada nudi potporu za 201 jezik i dijalekt, ciljajući globalne implementacije u tvrtkama koje posluju na više tržišta.

Alibaba predstavio Qwen 3.5: otvoreni AI div od 397 milijardi parametara

Komentari ~ 0

Alibaba predstavio Qwen 3.5: otvoreni AI div od 397 milijardi parametara

Komentari ~ 0