Anthropic je lansirao Claude Opus 4.5, dosad najmoćniju verziju svojeg velikog jezičnog modela, i pritom radikalno snizio cijene korištenja.
• Nova tarifa iznosi 5 USD za milijun ulaznih i 25 USD za milijun izlaznih tokena – otprilike dvije trećine manje od prethodne generacije Opus 4.1 (15 USD / 75 USD).
• Model je na internom inženjerskom ispitu tvrtke postigao najbolji rezultat u povijesti, nadmašivši sve ljudske kandidate kojima je test služio kao ulazni zadatak za posao.
• Na javnom mjerilu SWE-bench Verified, koje simulira stvarne softverske zadatke, Opus 4.5 ostvario je 80,9 % točnosti. Time je, po podacima Anthropica, prestigao Sonnet 4.5 (77,2 %) i Googleov Gemini 3 Pro (76,2 %).
Skok u „razumijevanju konteksta”
„Želimo da ovo zaista služi svima koji rade s modelima”, rekao je Alex Albert, voditelj odnosa s developerima u Anthropicu. „Naš je fokus: kako Claude može bolje preuzeti stvari koje u poslu možda ne želite raditi.”
Albert opisuje kako mu nova verzija olakšava svakodnevni rad: spaja se na Slack i interne dokumente te isporučuje sažetke koji su odmah prilagođeni njegovim prioritetima. „Model jednostavno kuži”, kaže. „Razvio je intuiciju i osjećaj za to što je važno u stvarnim situacijama, što je kvalitativno veliki skok u odnosu na ranije verzije.”
Tehnika paralelne obrade
Rekordni rezultat postignut je uz metodu parallel test-time compute, koja generira više simultanih rješenja i bira najbolje. Bez vremenskog ograničenja, Opus 4.5 u razvojnome okruženju Claude Code izjednačio se s dosad najuspješnijim ljudskim kandidatom.
U Anthropicu ipak priznaju da ispit ne mjeri timski rad, komunikacijske vještine ni iskustvo koje se stječe godinama. „Smatram da je to signal onoga što dolazi kad je riječ o korisnosti ovih modela u stvarnom poslu”, ističe Albert. „Inženjerstvo je trenutačno možda najviše odmaklo, ali poruka je važna za sve struke.”
Pritisak na konkurenciju
Objava stiže u trenutku sve žešće utrke na tržištu umjetne inteligencije. OpenAI je nedavno predstavio GPT-5.1 i specijalizirani koderski model Codex Max, dok je Google lansirao Gemini 3. Snižavanjem cijena i boljim rezultatima Anthropic pokušava proširiti krug korisnika i istodobno natjerati konkurente na reakciju.
Koliko će to utjecati na tržišni udio, tek treba vidjeti, no nova verzija Claudea jasno pokazuje da se granice onoga što AI može u profesionalnim zadacima i dalje ubrzano pomiču.