U samo četiri sata računalnog vremena Sakana AI, mlada tvrtka iz Tokija, demonstrirala je moć svog novog koderskog agenta ALE-Agent: u najnovijem izdanju AtCoder Heuristic Contesta (AHC058) zauzeo je prvo mjesto ispred više od 800 vrhunskih ljudskih natjecatelja.
Natjecanje AHC zahtijeva rješavanje složenih problemskih zadataka iz optimizacije, znatno izazovnijih od popularnih testova poput HumanEvala koji ispituju pisanje izoliranih funkcija. ALE-Agent je, zahvaljujući tehnici skaliranja tijekom izvođenja (eng. inference-time scaling), generirao, testirao i usavršio na stotine rješenja, pritom nadmašivši i elitne konkurentne programere.
Ključni detalji uspjeha:
- Vrijeme izvođenja: 4 sata.
- Broj poziva na modele velikih jezičnih modela (LLM-ovi): više od 4 000 prema GPT-5.2 i Gemini 3 Pro.
- Procijenjeni trošak računalnih resursa: oko 1 300 američkih dolara.
Iako se iznos od nekoliko tisuća dolara čini visokim za jedan zadatak, u realnim poslovnim procesima optimizacijski algoritmi mogu donijeti uštede vrijedne milijune dolara godišnje. Time se potvrđuje teza da je ulaganje u napredne AI agente ekonomski isplativo kada rezultira trajnim povećanjem učinkovitosti.
Rezultat ALE-Agenta upućuje na potencijalni preokret u načinu na koji se optimizacijski problemi rješavaju u poduzećima. Trenutačno se tvrtke oslanjaju na rijetke stručnjake koji ručno razvijaju kompleksne algoritme. Model koji se nazire nakon ovog natjecanja daleko je jednostavniji: ljudi definiraju „Scorer” – poslovnu logiku i ciljeve – a agent sam pronalazi optimalno rješenje.
Sakana AI stoga smatra da je pred nama razdoblje u kojem će autonomni agenti preuzimati sve veći dio tehničke implementacije, ostavljajući ljudima da se usredotoče na postavljanje strateških kriterija. U kontekstu brzorastuće ekonomije umjetne inteligencije, pobjeda ALE-Agenta na AtCoderu predstavljа simboličan, ali i vrlo konkretan dokaz da su sustavi sposobni za duboko rezoniranje u dinamičnim, višedimenzionalnim okruženjima već stigli.