Tvrtka AUI predstavila je Apollo-1, temeljni model za zadatno orijentirani dijalog koji bi trebao riješiti najveću boljku današnjih chatbotova – nepouzdanost u izvršavanju konkretnih radnji.
„The System Prompt isn’t a configuration file,” izjavio je osnivač i direktor Tal Elhelo. „It’s a behavioral contract. You define exactly how your agent must behave in situations of interest, and Apollo-1 guarantees those behaviors will execute.”
Za razliku od klasičnih velikih jezičnih modela, Apollo-1 razdvaja proceduralno znanje (koraci, ograničenja, tijekovi) od opisnoga (entiteti, atributi). Neuro-simbolički donositelj odluka potom deterministički određuje sljedeći potez pa, primjerice, aplikacija za dostavu hrane može nepogrešivo provjeriti alergene, a telekom operator automatski blokirati uslugu nakon tri neuspjele naplate.
Rezultati internih testova sugeriraju osjetan skok pouzdanosti: • 90 % završenih zadataka na τ-Bench-Airline (Claude-4: 60 %) • 83 % uspješnih rezervacija na Google Flights (Gemini 2.5-Flash: 22 %) • 91 % maloprodajnih scenarija na Amazonu (Rufus: 17 %)
„These aren’t incremental improvements,” naglasio je suosnivač Ben Cohen. „They’re order-of-magnitude reliability differences.”
Projekt je započeo još 2017., kada je AUI počeo strukturirati milijune razgovora svoje mreže od 60 000 ljudskih agenata. Godinama kasnije to se pretočilo u univerzalni „jezik” zadatnih dijaloga. „The insight was that task-oriented dialogue has universal procedural patterns,” dodao je Elhelo. „Food delivery, claims processing, and order management all share similar structures. Once you model that explicitly, you can compute over it deterministically.”
AUI tvrdi da Apollo-1 nije konkurencija velikim jezičnim modelima nego njihov nužan parnjak. „Transformers optimize for creative probability. Apollo-1 optimizes for behavioral certainty. Together, they form the complete spectrum of conversational AI.”
Model je već u ograničenim pilot-projektima s nekoliko anonimnih kompanija iz financija, turizma i maloprodaje, a potvrđeno je i strateško partnerstvo s Googleom. Opća dostupnost, uključujući API-je te govorne i slikovne mogućnosti, najavljena je za studeni 2025.
Upitan o daljnjim planovima, Elhelo je samo kratko poručio: „Let’s just say we’re preparing an announcement… Soon.”
Cohen je zaključio: „We’re on a mission to democratize access to AI that works.” Hoće li Apollo-1 doista postati novi standard pouzdanih poslovnih agenata, odlučit će sljedeći mjeseci pilotiranja.