OpenAI je jučer izbacio GPT-5.3-Codex, svoj dosad najsposobniji model za pisanje koda, točno u trenutku kad je konkurentski Anthropic predstavio nadograđeni Claude Opus 4.6. Paralelna lansiranja otvorila su, kako ih promatrači nazivaju, „rat koderskih modela” za dominaciju u unosnom tržištu poslovnog razvoja softvera.
Model je pomaknuo granice na više relevantnih mjerila:
• 57 % na SWE-Bench Pro, zahtjevnom skupu realnih inženjerskih zadataka na četiri programska jezika; • 77,3 % na Terminal-Bench 2.0, testu vještina rada u terminalu ključnih za koderske agente; • 64 % na OSWorldu, gdje modeli obavljaju produktivne zadatke u grafičkom sučelju računala.
Iz OpenAI-ja navode da su rane verzije GPT-5.3-Codexa same sebi pomagale pri otklanjanju grešaka u treningu, upravljanju infrastrukturom i analizi rezultata. Tvrtka ga opisuje kao „prvi model koji je bio ključan u vlastitom nastanku”.
Sigurnost u prvom planu
OpenAI je model po prvi put svrstao u kategoriju „visoke sposobnosti” za kibernetičke zadatke prema vlastitom okviru pripravnosti. GPT-5.3-Codex izravno je treniran za otkrivanje ranjivosti u softveru. „Iako nemamo decidirane dokaze da može automatizirati cjelovite kibernapade, poduzimamo mjere opreza i primjenjujemo dosad najopsežniji sigurnosni sloj”, stoji u priopćenju.
Dostupnost i sljedeći koraci
Model je odmah dostupan pretplatnicima ChatGPT-a kroz desktop aplikaciju, CLI, dodatke za razvojna okruženja i web sučelje, dok se API pristup najavljuje uskoro.