San Francisco dobio je novog ambicioznog igrača na tržištu umjetne inteligencije. OpenAGI, tvrtka koju vodi doktorand s MIT-a Zengyi Qin, u ponedjeljak je predstavila model Lux – sustav koji autonomno upravlja računalom analizirajući snimke zaslona i birajući potrebne klikove, tipke i poteze mišem.
Kritični test Na najzahtjevnijem javnom mjerilu za „računalne agente”, Online-Mind2Webu, Lux je ostvario 83,6 % uspjeha u izvršavanju 300 svakodnevnih zadataka na 136 internetskih stranica. Dosadašnji rekorder Operator iz OpenAI-ja stiže do 61,3 %, a Claude Computer Use iz Anthropica tek do 56,3 %.
Ključ je u načinu treniranja Većina velikih jezičnih modela uči predviđati sljedeću riječ u ogromnim nizovima teksta. Lux, tvrde u OpenAGI-ju, ide obrnutim putem: trenira se na kombinaciji snimki zaslona i niza radnji koje čovjek poduzima za ispunjenje cilja. Qin taj pristup naziva „agentičkim aktivnim prethodnim treniranjem” i objašnjava da model “sam istražuje sučelje, stvara nova iskustva i njima neprestano nadograđuje vlastito znanje”.
Širi domet i niži troškovi Za razliku od većine sadašnjih agenata koji rade isključivo u pregledniku, Lux može otvoriti Excel, Slack ili Adobe Illustrator, što mu otvara vrata mnogo širem spektru uredskih procesa. Tvrtka tvrdi da pritom troši desetinu troška vodećih komercijalnih rješenja i da zadatke obavlja brže.
Suradnje i sigurnost OpenAGI zajedno s Intelom optimizira Lux za rad na prijenosnicima i radnim stanicama – bez slanja osjetljivih podataka u oblak – a u tijeku su i razgovori s AMD-om i Microsoftom. Sigurnosni mehanizmi ugrađeni su izravno u model: kada korisnik zatraži radnju koja krši politiku zaštite podataka, sustav odbija izvršiti nalog i upozorava korisnika. Primjerice, na zahtjev „kopiraj moje bankovne podatke u novi dokument”, Lux je stao i izdao upozorenje.
Čovjek iza projekta Qin je doktorat na MIT-u stekao 2025., a već je poznat po izgradnji modela JetMoE treniranog za manje od 100 000 dolara, rješenja za kloniranje glasa OpenVoice (oko 35 000 GitHub zvjezdica) i sustava MeloTTS preuzetog više od 19 milijuna puta. Suosnivač je i platforme MyShell, na kojoj je šest milijuna korisnika izradilo više od 200 000 agenata.
Otvorena utrka Otprije su na ovom polju prisutni OpenAI, Anthropic, Google i Microsoft, no poduzeća i dalje dvoje zbog pouzdanosti i sigurnosti. Ako Lux zadrži laboratorijsku preciznost u stvarnim uredskim rutama, OpenAGI bi mogao poremetiti utrku u kojoj su dosad dominirali tehnološki divovi. Model i razvojni komplet od danas su dostupni zainteresiranim programerima.