CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

19. studenog 2025, 20:26

OpenAI lansirao GPT-5.1-Codex-Max, najnapredniji agent za programske zadatke

Novi Codex-Max donosi točnije dugoročno rezoniranje, 30 % manju potrošnju tokena i nadmašuje Googleov Gemini 3 Pro na ključnim testovima.

min. čitanja

XFacebookWhatsApp

OpenAI je predstavio GPT-5.1-Codex-Max, novu inačicu svog specijaliziranog modela za kodiranje koja preuzima ulogu zadanog agenta u svim Codex okruženjima.

Najvažnije novosti

• Preciznije dugoročno rezoniranje: na benchmarku SWE-Bench Verified model doseže 77,9 % točnosti pri najvišem stupnju rezoniranja, nadmašujući nedavno objavljeni Googleov Gemini 3 Pro (76,2 %).

• Učinkovitija upotreba tokena: zahvaljujući kompakciji model troši oko 30 % manje „thinking” tokena pri srednjem naporu, pa je brži i jeftiniji.

• Kontinuirani rad kroz milijune tokena: Codex-Max zadržava bitan kontekst i uspješno dovršava zadatke koji traju više od 24 sata, uključujući višestupanjske refaktore i autonomno otklanjanje grešaka.

• Šira dostupnost: verzija je već aktivna u Codex CLI-ju te u internim IDE proširenjima i alatima za kodni pregled. Javna API podrška tek dolazi, ali korisnici s ChatGPT Plus, Pro, Business, Edu i Enterprise pretplatama mogu joj pristupiti odmah.

• Sigurnosni nadzor: iako ne doseže OpenAI-jev prag „High” za kibernetičke sposobnosti, Codex-Max je trenutno njihova najjača obrambena opcija. Radi u izoliranom radnom prostoru, a mrežni pristup je po zadanim postavkama isključen.

Benchmark rezultati

• SWE-Lancer IC SWE: 79,9 % (prethodnik 66,3 %) • Terminal-Bench 2.0: 58,1 % (prethodnik 52,8 %; Gemini 3 Pro 54,2 %) • LiveCodeBench Pro Elo: 2 439 bodova – izjednačeno s Geminijem.

Arhitektonska poboljšanja

Ključno je uvođenje kompakcije, mehanizma koji filtrira nevažne dijelove konteksta kako se približava ograničenju prozora, čime održava fokus bez gubitka performansi. To otvara put agentu koji može obuhvatiti cijele repozitorije, a ne samo pojedine datoteke.

Radni primjeri prikazani uz lansiranje obuhvaćaju interaktivni simulator CartPole za učenje pojačanjem i optički alat Snell’s Law Explorer s dinamičkim praćenjem zraka.

Utjecaj na OpenAI-jev interni razvoj

Tvrtka navodi da 95 % njihovih inženjera koristi Codex barem jednom tjedno te da su, otkad je alat uveden, povećali prosječan broj pull requestova za oko 70 %. Unatoč tome, OpenAI podsjeća da model služi kao pomoćnik, a ne zamjena za ljudsku provjeru: svi prijedlozi koda prate se terminalskim zapisima i referencama na testove.

Zaključak

GPT-5.1-Codex-Max predstavlja velik korak prema autonomnim, ali nadziranim AI programerskim agentima. Uz dublje rezoniranje, bolju efikasnost i jače sigurnosne mjere, model utire put sljedećoj generaciji alata koji bi mogli preuzeti cijele projekte – uz nužan ljudski nadzor.

#google#openai#codex-max#gemini-pro#codex-cli
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Bivši Appleovi inženjeri predstavili „Button”, džepni AI uređaj nalik iPodu Shuffle
„Button” želi postati džepni most prema generativnoj AI, nudeći brže odgovore od ranijih pokušaja poput Humaneova AI bedža.

min čitanja

Više

Tehnologija

Meta predstavlja Muse Spark, prvi veliki korak prema „osobnoj superinteligenciji”
Tvrtka Marka Zuckerberga lansirala je novi AI model zatvorenog koda, s ambicijom da nadmaši konkurenciju i pruži medicinske savjete.
Anthony Quintano from Honolulu, HI, United States, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Anthropic predstavlja Claude Managed Agents i cilja na ubrzanje usvajanja AI-asistenata u poslovanju
Novi servis Anthropica donosi gotovu infrastrukturu za autonomne AI agente i stiže usred trostrukog rasta prihoda te utrke s OpenAI-jem za korporativne klijente.

min čitanja

Više

Tehnologija

iPhone dobio ocjenu D– za popravljivost: Samsungu i Googleu također loše ocjene
Potrošačka organizacija US PIRG rangirala je popravljivost uređaja: iPhone je najgori, dok Motorola prednjači. Ocjenjivanje se temelji na europskim indeksima i američkim kriterijima lobiranja.

min čitanja

Više

Tehnologija

Riječka subota u znaku znanosti i zdravlja
Rijeka u subotu otvara vrata četvrtom STEM pikniku: više od 40 radionica i predavanja u Art-kvartu Benčić pokazat će kako znanost i tehnologija unapređuju zdravlje i okoliš.

min čitanja

Više

Tehnologija

Besplatne STEM radionice na Grobniku u sklopu WRC Croatia Rallyja
U sklopu WRC Croatia Rallyja djeca će 9. i 10. travnja moći besplatno sudjelovati u ForSTEM radionicama i festivalu na Automotodromu Grobnik.

min čitanja

Više

Tehnologija

Gradska knjižnica Labin pokrenula ZaKi Book: digitalna posudba knjiga na svega nekoliko klikova
Nova digitalna platforma ZaKi Book omogućuje članovima Gradske knjižnice Labin da e-knjige i zvučne knjige preuzmu na mobitel, tablet, računalo ili e-ink čitač.

min čitanja

Više

Tehnologija

Rimčevi robotaksiji dobili petomjesečnu odgodu, Ministarstvo šturo o razlozima
Ministarstvo je Mate Rimcu i Projectu 3 Mobility pomaknulo rok za isporuku robotaksija na 31. kolovoza 2026., no javnosti nije otkrilo konkretne razloge za petomjesečnu odgodu.

min čitanja

Više

Tehnologija

Sukob Pentagona i Anthropica dobio novu sudsku rundu
Žalbeni sud u Washingtonu odbio je ukinuti oznaku rizika za opskrbni lanac koju je Pentagon nametnuo tvrtki Anthropic, čime je stvoren pravni sukob s presudom suda u San Franciscu.

min čitanja

Više

Tehnologija

Opatija u travnju postaje središte rasprave o inovacijama i sigurnosti europskog pomorstva
European Forum 2026 u Opatiji okuplja stručnjake, diplomate i inovatore kako bi raspravili sigurnost i tehnološki napredak europskog pomorskog sektora.

min čitanja

Više

Najčitanije

Politika

Šuta traži potpuni uvid u stanje Poljuda: „Građani moraju znati jesu li tribine sigurne”
Uoči tematske sjednice o Poljudu, gradonačelnik Split​a traži potpunu transparentnost i hitnu procjenu sigurnosti stadiona, upozoravajući na moguće financijske posljedice zbog zakašnjele javne nabave.

min čitanja

Više

Vijesti

Opatija ulaže gotovo 200 tisuća eura u rad lokalnih udruga
Grad je potpisao ugovore s 27 organizacija civilnog društva, pri čemu ukupna potpora udrugama za 2026. godinu doseže gotovo 200 tisuća eura.

min čitanja

Više

Ostalo

Benović zbog ozljede preskače preskok, u Osijeku juri plasman na SP kroz parter
Hrvatski olimpijac zbog ozljede odustaje od preskoka i u Gradskom vrtu lovi svjetsku normu isključivo kroz parter, usprkos dolasku olimpijskog prvaka Dolgopyata.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Biznis

Bolovanja u porastu: svaki dan s posla izostane 75.000 radnika

Politika

Dan Statuta Istre pretvoren u poziv na stvarnu decentralizaciju

Biznis

Deficit se produbljuje: izvoz pao, uvoz sporije, pokrivenost ispod 60 posto

Politika

Županija povećala proračun: 2,3 milijuna eura više za digitalizaciju i zdravstvene projekte

Vijesti

Španjol najavio TransMEDRI i selidbu Medicinskog fakulteta na Trsat

Biznis

Leo Pavela istaknuo kandidaturu za čelno mjesto riječke turističke zajednice

Biznis

Rast plaća postaje nova norma za poslodavce u jugoistočnoj Europi

Tehnologija

Bivši Appleovi inženjeri predstavili „Button”, džepni AI uređaj nalik iPodu Shuffle

Vijesti

Pljačka u splitskoj trgovini: maskirani razbojnik nožem zaprijetio zaposlenici

Sport

Radotić traži odgovornost: Osijek se raspao na Maksimiru nakon serije bez poraza

Vijesti

Maloljetnici u pritvoru nakon brutalnog napada u Dubravi