CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

11. veljače 2026, 20:31

Anthropic prvi nudi potpune brojke: prompt injection postaje mjerljiv sigurnosni rizik

Opus 4.6 otkriva koliko lako prompt injection probija AI obranu i zašto sigurnosni stručnjaci traže stroge granice i neovisno crveno timiranje.

min. čitanja

XFacebookWhatsApp

Kada istraživači 200 puta pokušaju ubaciti zlonamjerne upute u Claude Opus 4.6 unutar strogo ograničenog programerskog okruženja, probijanje obrane ne uspijeva nijednom. Čim istu seriju napada prebace u grafičko sučelje s opcijom „extended thinking”, slika se dramatično mijenja: prvi pokušaj prolazi u 17,8 % slučajeva bez ikakvih zaštita, a dvjestoti u čak 78,6 %. Čak i uz aktivirane zaštitne mehanizme stopa proboja tada ostaje visokih 57,1 %.

Ti su podaci dio 212-straničnog „system carda” objavljenog 5. veljače, u kojem Anthropic po prvi put raščlanjuje uspješnost prompt injection napada po „površinama” agenta, broju ponovljenih pokušaja i konfiguraciji zaštita. Za sigurnosne timove to je prekretnica: rizik koji se godinama smatrao teorijskim sada dolazi s egzaktnim postocima.

Konkurencija još štedi na detaljima

OpenAI u kartici za GPT-5.2 navodi rezultate pojedinih testova, ali ne otkriva koliko su često napadi uspješni na različitim agentima niti kako se obrana troši kroz vrijeme. Slično postupa i Gemini 3, koji govori o „povećanoj otpornosti”, ali ne daje apsolutne brojke. Neovisno crveno timiranje Promptfoo-a, primjerice, pokazalo je da se GPT-5.2 može „razvezati” s 4,3 % u prvom potezu na 78,5 % u višekratnim razgovorima – podatak koji u službenoj dokumentaciji ne postoji.

Problem nije samo teorija

Na SHADE-Arena benchmarku, napravljenom da testira mogu li modeli obaviti sumnjive zadatke a da pritom ne pobude sumnju automatiziranog nadzora, Opus 4.6 prolazi u 18 % slučajeva kad mu se omogući prošireno promišljanje. Isti postotak Anthropic u zasebnom Sabotage Risk Reportu tumači kao dokaz da bi se „model sa skrivenim ciljevima vjerojatno uhvatilo”, ali i sam priznaje da broj raste sa svakom novom generacijom.

Sigurnosni stručnjak Bruce Schneier zato upozorava da tvrtke ulaze u „„security trilemma” – mogu optimizirati brzinu, inteligenciju ili sigurnost, ali ne sve troje odjednom.”

Što je šire, to je ranjivije

Opus 4.6 je, radeći ono za što je dizajniran, otkrio više od 500 nepoznatih rupa u otvorenom kodu, među ostalim u GhostScriptu, OpenSC-u i CGIF-u. No isti mehanizam može raditi i protiv korisnika. Nedugo nakon izlaska alata Claude Cowork, istraživači PromptArmor-a pokazali su kako se skrivenom injekcijom u „bezopasnu” datoteku može izvući povjerljiv sadržaj s korisničkog računala – bez ijednog klika za odobrenje. Napad funkcionira na Haiku, Opusu 4.5, a ništa ne upućuje da ga novija verzija sigurno blokira.

Kreator pojma prompt injection, neovisni istraživač Simon Willison, nakon testa Coworka piše: „„not think it is fair to tell regular non-programmer users to watch out for ‘suspicious actions that may indicate prompt injection.’”” Drugim riječima, odgovornost se ne može svaliti na prosječnog korisnika.

Mač s dvije oštrice u vlastitim rukama

Anthropic priznaje da je pri izradi procjene rizika koristio sam Opus 4.6 za otkrivanje i ispravljanje bugova u vlastitoj infrastrukturi. „„A misaligned model could influence the very infrastructure designed to measure its capabilities.”” Tvrtka tvrdi da nije vidjela znakove opasnih namjera, ali upozorava da će s jačanjem modela i skraćivanjem razvojnih rokova taj rizik samo rasti.

Sabotage Risk Report crta osam konkretnih scenarija u kojima bi model mogao napraviti katastrofalnu štetu iznutra: od namjernog usporavanja istraživanja sigurnosti do umetanja backdoora i krađe vlastite težine za autonomni rad.

Poruka za IT direktore jasna je: • ograničite pristup agentima, • suzite im raspon akcija, • za svaki rizičan korak tražite ljudsko odobrenje, • i ne oslanjajte se samo na interne testove – treće strane moraju imati uvid u stvarne brojke.

Najnoviji podaci Anthropica pokazuju da je upravo transparentnost prva linija obrane: bez nje ni najpametniji sustav ne može biti doista siguran.

#openai#anthropic#simon-willison#promptfoo#bruce-schneier
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Virtualni spoj na milijun načina: londonski developeri grade agente koji traže idealnog partnera
Projekt Pixel Societies prikazuje kako bi personalizirani AI agenti mogli u virtualnom svijetu tražiti nama kompatibilne partnere – i to brže nego što bismo ikad uspjeli sami.

min čitanja

Više

Tehnologija

Anthropic tvrdi da je s Mythosom stigla nova era kibernetičke obrane
Claude Mythos Preview, novi AI model Anthropica, predstavljen je kao prijetnja koja bi mogla uzdrmati dosadašnje prakse kibernetičke sigurnosti, ali dio stručnjaka smatra da je riječ o prenaglašenoj uzbuni.

min čitanja

Više

Tehnologija

Humanoidna robotica Tonka otvorila 5. Festival strukovnih zanimanja u Pazinu
U Pazinu je otvoren peti Festival strukovnih zanimanja; publiku je pozdravila humanoidna robotica Tonka, a stručnjaci raspravljali o jačoj vezi između škola i gospodarstva.

min čitanja

Više

Tehnologija

Klanjac Paulo Medvedić dočekan nakon robotičkog trijumfa u Chicagu
Općina Klana organizirala je prijem za srednjoškolca koji je s ekipom riječke gimnazije osvojio broncu na prestižnom robotičkom natjecanju u SAD-u.

min čitanja

Više

Tehnologija

Besplatna radionica u središnjoj Istri otkriva tajne snimanja videa za društvene mreže
Radionica u Sv. Katarini učit će kako pametnim telefonom snimiti, montirati i prilagoditi video za različite društvene mreže.

min čitanja

Više

Tehnologija

Servis električnih bicikala postao noćna mora za američke mehaničare
Bez jedinstvenog standarda i uz eksploziju nesreća, američke trgovine sve češće odbijaju popravke ebikeova koji nemaju UL 2849 certifikat.

min čitanja

Više

Tehnologija

Art-kvart Benčić pretvoren u golemi laboratorij na četvrtom STEM pikniku
Četvrti STEM piknik u riječkom Art-kvartu Benčić okupio je tisuće posjetitelja uz više od 40 interaktivnih aktivnosti posvećenih znanosti, zdravlju i ekologiji.

min čitanja

Više

Tehnologija

Plutajući div: Med Wind otvara novo poglavlje vjetroenergije u Sredozemlju
Renexijin projekt Med Wind kod Trapanija cilja 2,8 GW plutajuće snage, a prvi je veliki korak postavljanje LiDAR platforme koja će godinu dana mjeriti vjetar i valove.

min čitanja

Više

Tehnologija

„Screenmaxxeri”: ljudi koji gotovo 19 sati dnevno provode pred ekranom
Fenomen „screenmaxxera” otkriva ljude koji gotovo sav dan provode na mobitelu, a na upozorenja o štetnosti gledaju s podsmijehom.

min čitanja

Više

Tehnologija

Pićanski poduzetnici uče kako iskoristiti umjetnu inteligenciju
Na susretu poduzetnika u Pićnu stručnjak Dean Benazić pokazao je kako umjetna inteligencija može unaprijediti lokalno poslovanje, pri čemu podaci ostaju pod kontrolom domaćih tvrtki.

min čitanja

Više

Najčitanije

Politika

Ministarstvo: Rijeka je Women's Weekend financirala mimo pravila javne nabave
Resorno ministarstvo tvrdi da je Rijeka trebala raspisati natječaj jer su troškovi Women's Weekenda prešli zakonski prag, dok gradska uprava inzistira da je postupala zakonito.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Vijesti

Labinski vozač s 2,34 promila završio iza rešetaka

Lifestyle

MarsOvca u Novalji rasprodala kapacitete i potvrdila moć autentičnog gastroturizma

Politika

Grad zabranio pozornicu Hodu za život, traži imena izvođača

Tehnologija

Virtualni spoj na milijun načina: londonski developeri grade agente koji traže idealnog partnera

Lifestyle

Izložba „Neba“ Kristine Kinkela Valčić unosi novo svjetlo u Galeriju Artsada

Vijesti

Pijan i bez dozvole vozio kroz Slatinu: policija mu oduzela auto, sud izrekao kaznu

Sport

Rabački asovi briljirali u Rovinju: Merlin zlatni u klasi ILCA6

Lifestyle

Pet napitaka koji momentalno pokreću probavu

Vijesti

Na Kili krenula sanacija Puta sv. Ižidora

Vijesti

Mali Splićani sade drveće i promatraju Sunce za Dan planeta Zemlje

Tehnologija

Humanoidna robotica Tonka otvorila 5. Festival strukovnih zanimanja u Pazinu