Zoom Video Communications, kompanija koja se proslavila održavanjem sastanaka na daljinu tijekom pandemije, objavila je da je njezin AI sustav ostvario najbolji rezultat u povijesti na testu Humanity's Last Exam – jednom od najzahtjevnijih izazova za umjetnu inteligenciju.
Prema priopćenju, Zoomov sustav postigao je 48,1 % točnosti i time nadmašio dosadašnjeg rekordera, Googleov Gemini 3 Pro, koji je držao 45,8 %. „Zoom has achieved a new state-of-the-art result on the challenging Humanity's Last Exam full-set benchmark, scoring 48.1 %, which represents a substantial 2.3 % improvement over the previous SOTA result”, napisao je glavni tehnološki direktor Xuedong Huang u službenom blogu.
Neočekivani skok ispred divova poput Googlea, OpenAI-ja i Anthropica odmah je potaknuo rasprave: kako je tvrtka orijentirana na videokonferencije bez vlastite povijesti treniranja velikih jezičnih modela uspjela ostvariti takav pothvat?
Ključ je u, kako Zoom tvrdi, „federiranom AI pristupu”. Umjesto da trenira vlastiti golemi model, tvrtka je razvila sustav koji upite prosljeđuje prema više postojećih modela OpenAI-ja, Googlea i Anthropica, potom internim softverom kombinira njihove odgovore.
Središte te arhitekture zauzima „Z-scorer”, mehanizam koji ocjenjuje pristigle odgovore i odabire najbolji. Taj se proces nadograđuje strategijom koju Zoom opisuje kao „explore-verify-federate” – radni tijek koji balansira istraživačko rezoniranje i međusobnu provjeru između više AI sustava.
Reakcije industrije su podijeljene. Jedni hvale inženjersku domišljatost koja demonstrira kako se dostupni modeli mogu nadmašiti u sinergiji, dok drugi smatraju da Zoom tek kreativno orkestrira tuđe alate i time ne rješava temeljni izazov stvaranja vlastite generalne inteligencije.
Ipak, brojka od 48,1 % na testu koncipiranom da „zaskoči” i najnaprednije sustave dala je Zoomu neočekivani legitimitet u utrci za AI primat – utrci u kojoj, očito, više nije važno samo tko posjeduje najveći model, nego i tko ga zna učinkovito usmjeriti.