Sanfranciski AI laboratorij Arcee lansirao je svoj dosad najveći i najmoćniji otvoreni jezični model – Trinity Large. Riječ je o modelu s 400 milijardi parametara koji koristi arhitekturu "mixture-of-experts" (MoE) i dostupan je u preview inačici za slobodno preuzimanje i prilagodbu.
Glavne značajke
• Ekstremna rijetkost aktivacije: samo 1,56 % ukupnih parametara (oko 13 milijardi) aktivira se u pojedinom zadatku, što donosi dvije do tri puta brže izvođenje u usporedbi s konkurentima na istoj opremi.
• Dvostruko izdanje: uz glavnu verziju Arcee objavljuje i "sirovi" kontrolni punkt Trinity-Large-TrueBase, treniran na 10 bilijuna tokena bez naknadnog uputa-tuniranja i reforcmenta.
• Transparentnost za regulirane sektore: TrueBase pruža polazište bez „crnih kutija”, što omogućuje neovisne revizije i prilagodbe usklađene sa strogim propisima.
• Konkurencija iz Kine: izlazak Trinity Largea dolazi u trenutku kada se tržište puni učinkovitijim open-source modelima kineskih tvrtki poput Alibaba Qwena, Zhipua, DeepSeeka, Moonshota i Baidua.
Iz kompanije naglašavaju znanstvenu vrijednost sirove verzije. Glavni tehnički direktor Lucas Atkins ocjenjuje: „Zanimljivo je da je taj checkpoint već jedan od najbolje izvedbenih baznih modela na svijetu”.
Arcee je već ranije stekao reputaciju kao jedan od rijetkih američkih subjekata koji velike jezične modele trenira od nule i objavljuje pod (djelomičnim) otvorenim licencama. S Trinity Largeom laboratorij nastavlja strategiju besplatne dostupnosti, ciljajući developere, start-upove i srednja do velika poduzeća koja žele graditi vlastita rješenja umjetne inteligencije bez visokih licencijskih troškova.