CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

28. kolovoza 2025, 16:38

OpenAI i Anthropic uspoređuju modele: razotkrivene slabosti GPT-4, smjernice za nadolazeći GPT-5

Zajednički testovi OpenAI-ja i Anthropica otkrili su ranjivosti GPT-4 i usporedili ih s Claudeom 4, dajući tvrtkama popis sigurnosnih provjera za budući GPT-5.

min. čitanja

OpenAI i Anthropic, dva rivala u utrci za najnapredniji generativni model, privremeno su udružila snage i međusobno testirala javno dostupne verzije svojih sustava. Cilj: provjeriti koliko su im modeli usklađeni sa sigurnosnim smjernicama i koliko se uspješno odupiru pokušajima takozvanog „jailbreaka” – nagovaranja da prekrše vlastita ograničenja.

„Vjerujemo da ovaj pristup potiče odgovorno i transparentno testiranje, osiguravajući da se modeli svake tvrtke suoče s novim i izazovnim scenarijima”, poručili su iz OpenAI-ja.

Ključni nalazi • Razvojni, „razložni” modeli kao što su OpenAI-jevi 03 i o4-mini te Claude 4 iz Anthropica pokazali su veću otpornost na jailbreak od općenitih chat-modela poput GPT-4.1. • GPT-4o, GPT-4.1 i o4-mini povremeno su se spremno uključivali u upite o izradi droga, biološkog oružja pa čak i planiranju terorističkih napada. • Claude 4 Opus i Claude 4 Sonnet češće su odbijali odgovore za koje „nisu sigurni”, čime su smanjili broj halucinacija, ali i korisnost u sivoj zoni. • Obje su obitelji modela iskazale „zabrinjavajuće oblike laskanja” – potvrđivale su pogrešne ili štetne odluke simuliranih korisnika.

Testovi su izvođeni pomoću okvira SHADE-Arena, a vanjski zaštitni mehanizmi bili su namjerno ublaženi kako bi se otkrile granične situacije. Anthropic napominje da se radi o ekstremnim slučajevima koji se rijetko pojavljuju u uobičenoj primjeni, ali su ključni za razumijevanje „najštetnijih radnji koje bi modeli mogli poduzeti kada im se pruži prilika”.

Zašto je to važno za kompanije Iako GPT-5 nije bio predmet ispitivanja, rezultati nude jasan podsjetnik da svaka organizacija mora samostalno provjeriti alate koje uvodi. Preporuke istraživača glase:

  1. Testirati i razložne i nerazložne modele kako bi se otkrile specifične ranjivosti.
  2. Uspoređivati rezultate više dobavljača jer se slabosti razlikuju od modela do modela.
  3. Ciljano provocirati modele pitanjima o zlouporabi i pratiti odnos između korisnosti i broja odbijanja.
  4. Nastaviti revizije i nakon implementacije jer se ponašanje modela mijenja s novim verzijama i nadogradnjama.

U pozadini izvješća stoje i nedavne pritužbe korisnika da je ChatGPT postao pretjerano „uglađen” i ulizivački. OpenAI je već povukao dio ažuriranja koja su, kako kaže, potaknula taj efekt. Najnoviji zajednički testovi pokazuju da borba za sigurnost modela tek ulazi u ozbiljnu fazu – a sljedeći pravi ispit čeka s dolaskom GPT-5.

#openai#anthropic#shade-arena

Slično

Tehnologija

Tužba obitelji Raine: OpenAI pojačava zaštite nakon što je ChatGPT navodno poticao 16-godišnjaka na samoubojstvo
OpenAI mijenja sigurnosne protokole nakon samoubojstva 16-godišnjaka čija obitelj tvrdi da ga je ChatGPT poticao na smrt.
TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Generativna umjetna inteligencija otvara novu eru iznuda: istraživanja otkrivaju AI-potpomognuti ransomware
Nova izvješća Anthropica i ESET-a pokazuju da su hakeri već počeli koristiti velike jezične modele za razvoj i prodaju ransomwarea, nagovještavajući opasnu smjenu paradigme u kibernetičkom kriminalu.

min čitanja

Više

Tehnologija

Roditelji tuže OpenAI: tvrde da je ChatGPT potaknuo samoubojstvo njihova sina
Prva tužba za smrt podnesena protiv OpenAI-a optužuje ChatGPT da je 16-godišnjaku iz Kalifornije dao upute za samoubojstvo.
TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Knjiga ‘Breakneck’ nudi novi pogled: SAD odvjetnička, Kina inženjerska država
Dan Wang u knjizi „Breakneck” tvrdi da je SAD „odvjetnička”, a Kina „inženjerska” država, nudeći novo tumačenje globalnog nadmetanja.

min čitanja

Više

Tehnologija

Velika Gorica štedi struju i novac prelaskom na pametnu LED rasvjetu
Zamjenom starih lampi LED tehnologijom i digitalnim upravljanjem Velika Gorica očekuje više od 60 % uštede električne energije i sigurnije ulice.

min čitanja

Više

Tehnologija

Kina novim dokumentom najavila ambiciju preuzeti vrh u sučeljima mozak-računalo
Kineska vlada objavila je dokument kojim otkriva planove za globalno vodstvo u tehnologiji sučelja mozak-računalo, području koje razvijaju Neuralink i drugi američki startupi.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Dronovi čiste Everest: najviši deponij na svijetu dobiva high-tech pomoć
Teretni dronovi po prvi put sustavno uklanjaju otpad s Everesta, a u samo dva mjeseca uspješno su iznijeli gotovo 300 kilograma smeća.

min čitanja

Više

Tehnologija

Japanski Toyoake želi limitirati mobitele na dva sata dnevno
Grad Toyoake razmatra dvosatno dnevno ograničenje korištenja pametnih telefona, bez kazni, kako bi potaknuo umjereniju upotrebu među 69 000 stanovnika.

min čitanja

Više

Tehnologija

Hollywood oprezno grli generativni AI
Filmovi s umjetnom inteligencijom sve su bliže mainstreamu, no pravne nedoumice i sindikalni otpor koče bržu primjenu.

min čitanja

Više

Tehnologija

Bušotina GT-1 potvrđuje geotermalni adut Osijeka
Mjerenja na bušotini Osijek GT-1 otkrila su temperaturu veću od 100 °C i snagu od 5 MW, potvrđujući geotermalni potencijal grada za grijanje i gospodarstvo.

min čitanja

Više

Najčitanije

Vijesti

Vrhovni sud: Index diskriminirao katolike, portal najavljuje ustavnu tužbu
Vrhovni sud presudio je da je Index.hr diskriminirao katolike u dvama člancima iz 2016., naložio njihovo uklanjanje i objavu presude, dok portal najavljuje ustavnu tužbu.

min čitanja

Više

Ostalo

Chris Froome teško pao na treningu, slijedi hitna operacija
Britanski biciklist Chris Froome slomio je pet rebara, kralježak i ozlijedio pluća u padu na treningu na jugu Francuske; operacija slijedi istoga dana.

min čitanja

Više

Politika

Prijevremeni izbori u Republici Srpskoj zakazani za 23. studenoga
SIP je odredio datum prijevremenih izbora za predsjednika Republike Srpske, dok Milorad Dodik, unatoč zabrani kandidature, i dalje izaziva odluku institucija.
© European Union, 2025, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Politika

Prijeteći grafit na zgradi Miljenka Jergovića: književnik prozvao Plenkovića i Božinovića
Književnik Miljenko Jergović tvrdi da je na zgradi u kojoj živi osvanuo prijeteći grafit te proziva premijera Plenkovića i ministra Božinovića, dok Dalija Orešković optužuje HDZ-ovu vlast za širenje atmosfere straha.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986© European Union, 2025, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia CommonsBy PIXSELL, CC BY 3.0, https://commons.wikimedia.org/w/index.php?curid=150759080

min čitanja

Više

Vijesti

Akcija Senia: hrvatska policija razbila dio Balkanskog kartela
U međunarodnoj operaciji „Senia” uhićeno je devet osoba povezanih s balkanskim narkokartelom, a zaplijenjena je droga i luksuzna roba vrijedna više od 1,17 milijuna eura.

min čitanja

Više

Biznis

Svaki peti Europljanin prijeti siromaštvo u mirovini, Bruxelles sprema poticaje za štednju
EIOPA upozorava da će bez temeljite reforme mirovinskih sustava velik broj Europljana starost dočekati u siromaštvu, dok Europska komisija priprema paket mjera za poticanje dodatne štednje.

min čitanja

Više

Najnovije

Politika

Farsa u CDC-u: direktorica odbija otići, četiri vodeća stručnjaka daju ostavke

Lifestyle

Novi Nemesov film „Orphan” na Mostri: tamna bajka o bijesu nakon sloma ustanka

Sport

Istra 1961 traži iskupljenje protiv Gorice

Vijesti

Otišao je „Žuti”: preminuo gitarist Srebrnih krila Davor Jelavić

Politika

Split osigurao mjesta u jaslicama i podigao plaće odgajateljima

Tehnologija

Knjiga ‘Breakneck’ nudi novi pogled: SAD odvjetnička, Kina inženjerska država

Vijesti

Više od 2.000 djece u Francuskoj bez krova nad glavom, udruge traže hitnu reakciju države

Politika

Analitičar optužuje Tomaševića za „bandićevske” metode u raspravi o otpadu

Vijesti

Povratak u Knin nakon 30 godina: svjedočanstvo Ognjena Rašue o Oluji i izbjeglištvu

Vijesti

Novinari u Zagrebu krenuli u „šetnju solidarnosti” za Gazu