Allen Institute for AI (AI2) predstavio je novu generaciju svojih jezičnih modela pod nazivom Olmo 3, pri čemu je najveću pozornost privukla nadogradnja Olmo 3.1. Riječ je o dosad najmoćnijoj obitelji modela iz AI2-a, razvijenoj kako bi poslovnim korisnicima ponudila više učinkovitosti, transparentnosti i upravljivosti.
Najnovija linija obuhvaća dva 32-milijardna modela:
• Olmo 3.1 Think 32B – prilagođen naprednim istraživanjima i dubinskoj analitici.
• Olmo 3.1 Instruct 32B – optimiziran za praćenje uputa, višekratni dijalog i korištenje alata.
Ključni iskorak postignut je produljenim treniranjem najboljeg ciklusa pojačanog učenja (RL) s Olma 3, što je dovelo do znatnih poboljšanja u matematičkim zadacima, rezoniranju i razumijevanju uputa na nizu standardnih mjerila. Uz to, znanstvenici su primijenili metode skaliranja kako bi modeli bolje funkcionirali u stvarnim primjenama, gdje su robusnost i brzina presudni.
AI2 naglašava da se posebna pažnja posvetila smanjenju troškova izvođenja te većoj transparentnosti procesa, što tvrtkama olakšava integraciju modela u vlastite sustave i strožu kontrolu nad izlaznim podacima.
Objavom Olma 3.1 AI2 stavlja dodatni pritisak na konkurenciju u segmentu velikih jezičnih modela, nudeći kombinaciju visokih performansi i rješenja usmjerenih na konkretne potrebe poduzeća.