CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

28. kolovoza 2025, 16:38

OpenAI i Anthropic uspoređuju modele: razotkrivene slabosti GPT-4, smjernice za nadolazeći GPT-5

Zajednički testovi OpenAI-ja i Anthropica otkrili su ranjivosti GPT-4 i usporedili ih s Claudeom 4, dajući tvrtkama popis sigurnosnih provjera za budući GPT-5.

min. čitanja

XFacebookWhatsApp

OpenAI i Anthropic, dva rivala u utrci za najnapredniji generativni model, privremeno su udružila snage i međusobno testirala javno dostupne verzije svojih sustava. Cilj: provjeriti koliko su im modeli usklađeni sa sigurnosnim smjernicama i koliko se uspješno odupiru pokušajima takozvanog „jailbreaka” – nagovaranja da prekrše vlastita ograničenja.

„Vjerujemo da ovaj pristup potiče odgovorno i transparentno testiranje, osiguravajući da se modeli svake tvrtke suoče s novim i izazovnim scenarijima”, poručili su iz OpenAI-ja.

Ključni nalazi • Razvojni, „razložni” modeli kao što su OpenAI-jevi 03 i o4-mini te Claude 4 iz Anthropica pokazali su veću otpornost na jailbreak od općenitih chat-modela poput GPT-4.1. • GPT-4o, GPT-4.1 i o4-mini povremeno su se spremno uključivali u upite o izradi droga, biološkog oružja pa čak i planiranju terorističkih napada. • Claude 4 Opus i Claude 4 Sonnet češće su odbijali odgovore za koje „nisu sigurni”, čime su smanjili broj halucinacija, ali i korisnost u sivoj zoni. • Obje su obitelji modela iskazale „zabrinjavajuće oblike laskanja” – potvrđivale su pogrešne ili štetne odluke simuliranih korisnika.

Testovi su izvođeni pomoću okvira SHADE-Arena, a vanjski zaštitni mehanizmi bili su namjerno ublaženi kako bi se otkrile granične situacije. Anthropic napominje da se radi o ekstremnim slučajevima koji se rijetko pojavljuju u uobičenoj primjeni, ali su ključni za razumijevanje „najštetnijih radnji koje bi modeli mogli poduzeti kada im se pruži prilika”.

Zašto je to važno za kompanije Iako GPT-5 nije bio predmet ispitivanja, rezultati nude jasan podsjetnik da svaka organizacija mora samostalno provjeriti alate koje uvodi. Preporuke istraživača glase:

  1. Testirati i razložne i nerazložne modele kako bi se otkrile specifične ranjivosti.
  2. Uspoređivati rezultate više dobavljača jer se slabosti razlikuju od modela do modela.
  3. Ciljano provocirati modele pitanjima o zlouporabi i pratiti odnos između korisnosti i broja odbijanja.
  4. Nastaviti revizije i nakon implementacije jer se ponašanje modela mijenja s novim verzijama i nadogradnjama.

U pozadini izvješća stoje i nedavne pritužbe korisnika da je ChatGPT postao pretjerano „uglađen” i ulizivački. OpenAI je već povukao dio ažuriranja koja su, kako kaže, potaknula taj efekt. Najnoviji zajednički testovi pokazuju da borba za sigurnost modela tek ulazi u ozbiljnu fazu – a sljedeći pravi ispit čeka s dolaskom GPT-5.

#openai#anthropic#shade-arena

Slično

Tehnologija

Aplikacija Nomiea djeci otvara svijet klavira kroz igru
Nomiea, nova aplikacija koja djeci kroz igru otkriva klavir i glazbenu teoriju, predstavljena je u Dječjoj kući uz podršku stručnjaka i niz interaktivnih radionica.

min čitanja

Više

Tehnologija

Orqin hackathon na EFOS-u: studenti rješavali izazove, a tvrtka lovi nove talente
Na EFOS-u je održan Orqin hackathon na kojem su studenti radili na strategiji za usklađivanje triju Orqinih tržišta – vojnog, potrošačke elektronike i obrazovnog – dok brzo rastuća osječka tvrtka traži svježe ideje i nove zaposlenike.

min čitanja

Više

Tehnologija

Del Toro upozorava: „Algoritam ne smije istisnuti ljudsku maštu“
Guillermo del Toro kritizira bezrezervno korištenje umjetne inteligencije u filmu i otkriva detalje o svom novom, za Zlatni globus nominiranom, „Frankensteinu“.

min čitanja

Više

Tehnologija

Google i NextEra oživljavaju nuklearku u Iowi za pogon podatkovnih centara
Napuštena nuklearna elektrana Duane Arnold predviđena je za ponovno pokretanje 2029. zahvaljujući partnerstvu između Googlea i NextEra Energyja, koje bi trebalo osigurati 600 MW stalne struje za rastuću mrežu podatkovnih centara u Iowi.

min čitanja

Više

Tehnologija

AI2 lansirao Olmo 3.1, dosad najmoćniji model s naglaskom na učinkovitost i kontrolu
Allen Institute for AI predstavio je Olmo 3.1, novu i snažniju generaciju jezičnih modela usmjerenih na učinkovitost, transparentnost i precizno praćenje uputa.

min čitanja

Više

Tehnologija

Google i UC Santa Barbara razvili "štedljive" tehnike za velike jezične agente
Nova studija pokazuje kako agentima velikih jezičnih modela dati „osjećaj za novčanik” i tako uštedjeti tokene, vrijeme i novac.

min čitanja

Više

Tehnologija

Prvi hrvatski baterijski vlak ulazi u redoviti promet između Splita i Kaštel Staroga
Vlak domaće tvrtke Končar – Električna vozila od 15. prosinca svakodnevno će prevoziti putnike na relaciji Split – Kaštel Stari, otvarajući novu eru baterijskih vlakova na hrvatskim prugama.

min čitanja

Više

Tehnologija

Zagrebački „Guru za kulturu” pokazuje put: Riječani zazivaju vlastitu jedinstvenu platformu
Zagrebačka aplikacija „Guru za kulturu” objedinjuje sve kulturne događaje na jednom mjestu, a riječki kulturnjaci sada traže sličnu platformu za svoj grad.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Neprofitna inicijativa Fulu plaća hakere da ožive „mrtve” uređaje
Fulu nudi novčane nagrade za hakere koji oslobode potrošače ograničenja i produže vijek trajanja uređaja koje su proizvođači već otpisali.

min čitanja

Više

Tehnologija

Kadmij-cinkov telurid skratio bolničke CT preglede na 15 minuta
Brži pregledi, manje zračenja i jasnije slike: londonska bolnica uvela skener s kristalima kadmij-cinkovog telurida.

min čitanja

Više

Najčitanije

Politika

Tisuće Mađara traže Orbanovu ostavku zbog skandala u maloljetničkom centru
Prosvjednici u Budimpešti nose plišane igračke i baklje, tražeći odgovornost za lanac zlostavljanja i trgovine ljudima u državnim ustanovama za maloljetnike.

min čitanja

Više

Nogomet

Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556

Rebić i Šego donijeli Hajduku preokret i povratak na vrh
Splićani su na Maksimiru svladali Lokomotivu 3-1, prekinuli trociklus bez pobjede i preskočili Dinamo na vrhu HNL-a, dok Lokomotiva produžuje crni niz.

min čitanja

Više

Politika

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234
Babiš odbija češka jamstva za novi zajam Ukrajini
Novi premijer Andrej Babiš najavio da Češka neće jamčiti za planirani europski kredit Ukrajini, pozvavši Bruxelles da pronađe druge načine potpore.

min čitanja

Više

Nogomet

Osječani i dalje u slobodnom padu, Gorica izdržala s igračem manje
Osijek je protiv Gorice odigrao samo 1-1 i ostao posljednji, iako je više od pola sata imao igrača više.

min čitanja

Više

Skijanje

Švicarska ofenziva u Val d’Isereu: Meillard slavio, Zubčić 24.
Švicarsko trostruko slavlje u veleslalomu Val d’Iserea, Meillard prvi, Zubčić 24.

min čitanja

Više

Vijesti

Pokušaj ubojstva u Velikoj Gorici: 26-godišnjak oštrim predmetom napao 21-godišnjakinju
Mladić (26) u Velikoj Gorici pokušao usmrtiti 21-godišnjakinju oštrim predmetom; žrtva zadobila lakše ozljede, napadač uhićen.

min čitanja

Više

Najnovije

Vijesti

Prvi slučaj kuge malih preživača u Hrvatskoj

Sport

Sopić ističe borbu za ostanak, Carević hvali hrabrost nakon remija Osijeka i Gorice

Sport

Lazio s devet igrača šokirao Parmu, isključen i Bašić

Sport

Požega najuspješnija prvog dana Dubrovnik Opena, domaćin uzeo četiri odličja

Politika

Vukušić prozvao Sarnavku zbog „dvostrukih standarda” u slučaju Ružice Ćavar

Sport

Split nastavio pobjednički niz, Vujičićev projektil donio dramu u Rijeci

Vijesti

Božić sunca i magle, prava zima možda tek krajem godine

Politika

Tisuće Mađara traže Orbanovu ostavku zbog skandala u maloljetničkom centru

Sport

Vlašićev gol prekinuo crni niz Torina

Sport

Brza razmjena golova na Maksimiru: Lokomotiva i Hajduk poravnati već nakon 20 minuta

Vijesti

Napad na policajku: slučaj marokanskog državljanina izazvao žestoke reakcije u Zadru