CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

19. studenog 2025, 20:26

OpenAI lansirao GPT-5.1-Codex-Max, najnapredniji agent za programske zadatke

Novi Codex-Max donosi točnije dugoročno rezoniranje, 30 % manju potrošnju tokena i nadmašuje Googleov Gemini 3 Pro na ključnim testovima.

min. čitanja

XFacebookWhatsApp

OpenAI je predstavio GPT-5.1-Codex-Max, novu inačicu svog specijaliziranog modela za kodiranje koja preuzima ulogu zadanog agenta u svim Codex okruženjima.

Najvažnije novosti

• Preciznije dugoročno rezoniranje: na benchmarku SWE-Bench Verified model doseže 77,9 % točnosti pri najvišem stupnju rezoniranja, nadmašujući nedavno objavljeni Googleov Gemini 3 Pro (76,2 %).

• Učinkovitija upotreba tokena: zahvaljujući kompakciji model troši oko 30 % manje „thinking” tokena pri srednjem naporu, pa je brži i jeftiniji.

• Kontinuirani rad kroz milijune tokena: Codex-Max zadržava bitan kontekst i uspješno dovršava zadatke koji traju više od 24 sata, uključujući višestupanjske refaktore i autonomno otklanjanje grešaka.

• Šira dostupnost: verzija je već aktivna u Codex CLI-ju te u internim IDE proširenjima i alatima za kodni pregled. Javna API podrška tek dolazi, ali korisnici s ChatGPT Plus, Pro, Business, Edu i Enterprise pretplatama mogu joj pristupiti odmah.

• Sigurnosni nadzor: iako ne doseže OpenAI-jev prag „High” za kibernetičke sposobnosti, Codex-Max je trenutno njihova najjača obrambena opcija. Radi u izoliranom radnom prostoru, a mrežni pristup je po zadanim postavkama isključen.

Benchmark rezultati

• SWE-Lancer IC SWE: 79,9 % (prethodnik 66,3 %) • Terminal-Bench 2.0: 58,1 % (prethodnik 52,8 %; Gemini 3 Pro 54,2 %) • LiveCodeBench Pro Elo: 2 439 bodova – izjednačeno s Geminijem.

Arhitektonska poboljšanja

Ključno je uvođenje kompakcije, mehanizma koji filtrira nevažne dijelove konteksta kako se približava ograničenju prozora, čime održava fokus bez gubitka performansi. To otvara put agentu koji može obuhvatiti cijele repozitorije, a ne samo pojedine datoteke.

Radni primjeri prikazani uz lansiranje obuhvaćaju interaktivni simulator CartPole za učenje pojačanjem i optički alat Snell’s Law Explorer s dinamičkim praćenjem zraka.

Utjecaj na OpenAI-jev interni razvoj

Tvrtka navodi da 95 % njihovih inženjera koristi Codex barem jednom tjedno te da su, otkad je alat uveden, povećali prosječan broj pull requestova za oko 70 %. Unatoč tome, OpenAI podsjeća da model služi kao pomoćnik, a ne zamjena za ljudsku provjeru: svi prijedlozi koda prate se terminalskim zapisima i referencama na testove.

Zaključak

GPT-5.1-Codex-Max predstavlja velik korak prema autonomnim, ali nadziranim AI programerskim agentima. Uz dublje rezoniranje, bolju efikasnost i jače sigurnosne mjere, model utire put sljedećoj generaciji alata koji bi mogli preuzeti cijele projekte – uz nužan ljudski nadzor.

#google#openai#codex-max#gemini-pro#codex-cli

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Lažni brojevi telefona probijaju se u Googleove AI sažetke
Lažni brojevi korisničke podrške pojavljuju se u Googleovim AI Sažecima, a prevaranti tako dolaze do podataka žrtava. Stručnjaci savjetuju dvostruku provjeru kontakata.

min čitanja

Više

Tehnologija

Novi fakultativni predmet o umjetnoj inteligenciji stiže u sve srednje škole
Od nove školske godine svi hrvatski srednjoškolci moći će birati predmet o umjetnoj inteligenciji, a stručnjaci upozoravaju da će ključ uspjeha biti dobro osposobljeni nastavnici i jednaka dostupnost u svim školama.

min čitanja

Više

Tehnologija

Groq i DeepSeek najavljuju novu stepenicu u AI utrci: Nvidia pred ključnom odlukom
Brza inferencija Groqovih LPU čipova i štedljivi MoE pristup DeepSeeka nagovješćuju novi skok u umjetnoj inteligenciji, a potez Nvidije mogao bi presuditi tko će vladati idućom fazom tržišta.

min čitanja

Više

Tehnologija

Splitski start-upovi oduševili Amsterdam i pokazali europski potencijal
Sedam start-upova okupljenih oko „Digitalne Dalmacije” impresioniralo je investitore u Amsterdamu i otvorilo vrata širenju na europsko tržište.

min čitanja

Više

Tehnologija

Kijin prototip EV2 oduševio na ekstremnom norveškom minusu
Prototip Kia EV2 prešao je 310 km na –21 °C i najavio serijsku proizvodnju, dok je brat EV4 potvrdio Kijinu dominaciju na najhladnijem El Prix testu ikad.

min čitanja

Više

Tehnologija

Znanstvenici otkrili dva ključna „skoka” u ljudskom starenju
Stanfordova studija pokazala je da tijelo prolazi kroz dva izražena vala ubrzanog starenja – prvi sredinom četrdesetih, a drugi oko šezdesete godine.

min čitanja

Više

Tehnologija

Spermiji prkose klasičnoj fizici zahvaljujući „čudnoj elastičnosti”
Istraživači sa Sveučilišta u Kyotu otkrili su da se spermiji i alge kreću kroz guste tekućine mehanizmom koji zaobilazi klasični Newtonov zakon djelovanja i reakcije.

min čitanja

Više

Tehnologija

Pentagon navodno koristio AI Claude u tajnoj akciji uhićenja Madura
Tvrdnje da je Pentagon pri uhićenju Nicolása Madura koristio umjetnu inteligenciju Claude pokrenule su raspravu o granicama vojne primjene naprednih AI sustava.

min čitanja

Više

Tehnologija

Musk i Bezos ubrzavaju lunarne planove uoči kineskog roka
SpaceX i Blue Origin preusmjeravaju resurse na lunarne projekte kako bi prestigli Kinu i osigurali dominaciju u svemirskom sektoru.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Nova posada Crew 12 pristala na ISS nakon zdravstvenog incidenta prethodnika
SpaceX-ova kapsula dovela četiri astronauta na orbitalni laboratorij, gdje će zamijeniti ekipu koja se ranije vratila zbog zdravstvenog problema.

min čitanja

Više

Najčitanije

Vijesti

Osumnjičeni za masakr na Bondiju prvi put pred sudom
Naveed Akram, optužen za smrtonosnu pucnjavu na plaži Bondi, pojavio se pred sudom putem videoveze; čeka ga 59 točaka optužbe, a proces se nastavlja u travnju.

min čitanja

Više

Politika

Stubb: Američki ton blaži, ali strateški prioriteti ostaju nepromijenjeni
Predsjednik Finske u Münchenu upozorava da, unatoč blažem nastupu Washingtona, temeljni prioriteti američke sigurnosne politike ostaju usmjereni izvan Europe.
By U.S. Department of State - https://www.flickr.com/photos/statephotos/54295399868/, Public Domain, https://commons.wikimedia.org/w/index.php?curid=159470623

min čitanja

Više

Lifestyle

Lelek s „Andromedom” osvojio Doru i putuje na Eurosong u Beč
Grupa Lelek trijumfirala je na Dori 2026. i izborila nastup na Eurosongu u Beču s pjesmom „Andromeda”.

min čitanja

Više

Najnovije

Sport

Norvežanke dominirale velikom skakaonicom, Prevc uzela broncu

Lifestyle

Cold Snap zatvorio Doru energičnim singlom „MUCHO MACHO”

Sport

Barukčić se okitila zlatom u Fujairahu

Lifestyle

Martin Kosovec objavio „Grazie Signore” i najavio prvi solistički koncert

Politika

Smrt u istražnom zatvoru razotkrila 20-godišnje otezanje slučaja

Vijesti

Zbog vode na kolniku zatvorena državna cesta Novigrad–Poreč

Vijesti

Sicilijani traže povratak remek-djela: Antonellov „Ecce Homo” žele vidjeti u Messini

Politika

Prosvjed ispred HRT-a: poziv na bojkot Eurovizije zbog izraelskog sudjelovanja

Sport

Maxey i Edwards vodili USA Stars do trijumfa na novom All-Star turniru

Lifestyle

Koliko dugo kofein ostaje u tijelu i kada ga treba izbjegavati

Politika

Država mijenja model stanogradnje: do 2030. planirano 8 000 priuštivih stanova