CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

2. prosinca 2025, 06:37

Jedan upit blokiran, deset prolazi: višekratni napadi ruše sigurnost otvorenih AI modela

Ciscoovo istraživanje otkriva da upornost napadača dramatično povećava uspjeh „jailbreak” napada na otvorene AI modele, sa 13 % na čak 92 %, te poziva poduzeća na jače zaštitne mjere.

min. čitanja

XFacebookWhatsApp

Najnovije istraživanje Cisco AI Threat Research and Security tima pokazuje koliki je jaz između laboratorijskih testova i stvarnih prijetnji umjetnoj inteligenciji. Ako napadač pošalje samo jedan zlonamjeran upit, otvoreni modeli u prosjeku odbiju 87 % pokušaja. No čim se isti napadač upusti u duži razgovor, koristeći probe, preoblikovanje i postupnu eskalaciju, stopa uspjeha napada skače na 92 %.

"A lot of these models have started getting a little bit better. When you attack it once, with single-turn attacks, they're able to protect it. But when you go from single-turn to multi-turn, all of a sudden these models are starting to display vulnerabilities where the attacks are succeeding, almost 80 % in some cases", izjavio je DJ Sampath, potpredsjednik Ciscoova odjela za AI softverske platforme.

Studija „Death by a Thousand Prompts: Open Model Vulnerability Analysis” pratila je osam popularnih otvorenih modela – od Qwen3-32B i Gemme do Llama 3 i Mistrala Large-2 – isključivo black-box metodom, kakvu u praksi rabe stvarni napadači. Rezultat: prosječna stopa uspjeha jednokratnih napada iznosila je 13,11 %, dok je kod višekratnih razgovora porasla na 64,21 %. Mistral Large-2 posebno se istaknuo negativnim rekordom od 92,78 % uspješnih „jailbreakova”.

Istraživači su identificirali pet glavnih taktika:

  1. Rastavljanje informacija i ponovno sastavljanje – dijeljenje štetnog zahtjeva na bezazlene dijelove, pa ponovno spajanje (95 % uspjeha na Mistralu).
  2. Kontekstualna dvosmislenost – nejasni okviri koji zbunjuju sigurnosne klasifikatore (94,78 %).
  3. Napad kaskadom (crescendo) – postupna eskalacija od bezopasnog do štetnog sadržaja (92,69 %).
  4. Uloga i persona – fiktivni konteksti koji „normaliziraju” zabranjeni sadržaj (92,44 %).
  5. Preformuliranje nakon odbijanja – uporno mijenjanje obrazloženja dok model ne popusti (89,15 %).

Autori rada zaključuju: "This escalation, ranging from 2x to 10x, stems from models' inability to maintain contextual defenses over extended dialogues, allowing attackers to refine prompts and bypass safeguards." Drugim riječima, sama upornost – ne nužno sofisticiranost – otvara vrata zloupotrebi.

Paradoks je što su upravo otvoreni i otvoreno-ponderirani modeli ključni pokretači inovacija u kibernetičkoj industriji: ubrzavaju razvoj start-upova, smanjuju ovisnost o dobavljačima i omogućuju prilagodbu koju vlasnički modeli teško prate. Cisco zato ne poziva na bojkot otvorenih modela, nego na realno sagledavanje rizika.

"Open source has its own set of drawbacks. When you start to pull a model that is open weight, you have to think through what the security implications are and make sure that you're constantly putting the right types of guardrails around the model", upozorava Sampath.

Za direktore informacijskih sigurnosti poruka je jasna: model koji prolazi standardne jednokratne testove možda će se slomiti pod „tisuću upita”. Bez dodatnih mehanizama nadzora, filtriranja i ograničavanja konteksta, korisnički chatbot ili interni kopilot može postati ulazna točka za ozbiljne kompromitacije.

#cisco#dj-sampath#gemma#llama-3#mistral-large

Slično

Tehnologija

Apptio spaja financije i IT: jedinstveni pogled na troškove ubrzava odluke
Apptio predstavlja rješenje koje ujedinjuje financijske, operativne i poslovne podatke, omogućujući brže i točnije odluke o tehnološkim ulaganjima u doba eksplozije AI-a i clouda.

min čitanja

Više

Tehnologija

Pet velikih prekretnica: znanstvenici mapirali kako se mozak mijenja od djetinjstva do duboke starosti
Istraživači sa Sveučilišta Cambridge otkrili su da se ljudski mozak radikalno preoblikuje pet puta, s ključnim prekretnicama u dobi od 9, 32, 66 i 83 godine.

min čitanja

Više

Tehnologija

Američki startup Arcee AI lansirao Trinity Mini i Nano, najavio gigantski model za 2026.
Trinity obitelj donosi otvorene modele trenirane isključivo u SAD-u; najveći, Trinity Large, stiže početkom 2026.

min čitanja

Više

Tehnologija

Kineski DeepSeek otvorio novu frontu u AI utrci s GPT-om i Geminijem
DeepSeek je objavio open-source modele koji po rezultatima i cijeni izvedbe izazivaju GPT-5 i Gemini-3.0-Pro, unatoč političkim pritiscima i ograničenjima čipova.

min čitanja

Više

Tehnologija

Osijek uoči Green Matrix Summita: Slavonija pokazuje kako izgleda zelena i digitalna budućnost
Treće izdanje Green Matrix Summita 4. i 5. prosinca u Osijeku okuplja više od pedeset stručnjaka kako bi ubrzali zelenu i digitalnu tranziciju gospodarstva Slavonije.

min čitanja

Više

Tehnologija

Američka tvrtka Flock snimke iz nadzornih kamera šalje na obradu radnicima u inozemstvu
Otkrivene upute i popisi radnika pokazuju da Flock nadzorne snimke iz SAD-a označava radnicima na Filipinima, što potiče nova pitanja o privatnosti i nadzoru.

min čitanja

Više

Tehnologija

Cyber Monday donosi najjeftiniji HBO Max do sada: 3 dolara mjesečno, ali samo za nove korisnike
HBO Max, Disney Plus, Hulu i Apple TV+ snažno spuštaju cijene za Cyber Monday, ali popusti vrijede samo onima koji se prijavljuju prvi put.

min čitanja

Više

Tehnologija

Utrka s AI napadima: hibridna cloud sigurnost traži hitan zaokret
Umjetna inteligencija ubrzala je kibernetičke napade, a stari modeli zaštite više ne prate tempo. Istraživanja otkrivaju rekordne stope provala, dok CrowdStrike najavljuje sustav koji reagira u sekundama.

min čitanja

Više

Tehnologija

AWS i Visa udružuju snage za brži razvoj agentične trgovine
AWS donosi Visa Intelligence Commerce na svoj Marketplace i najavljuje otvorene nacrte za izgradnju AI agenata koji samostalno obavljaju kupnju i plaćanja.

min čitanja

Više

Tehnologija

Ruby gubi sjaj: od omiljenog jezika početnika do tereta naslijeđenih kodova
Nekoć hit među start-upovima, Ruby se danas bori s lošim performansama, gubitkom popularnosti i ovisnošću o Ruby on Railsu.

min čitanja

Više

Najčitanije

Vijesti

Plava vrpca Vjesnika okupila heroje mora: od Omiša do Premude
Svečanost u Opatiji okupila hrabre spasitelje; glavna priznanja dobili Omišanin Mario Popovac, mještani Premude i crnogorska mornarica, dok je posebno priznanje pripalo profesoru Alenu Jugoviću.

min čitanja

Više

Politika

Tisuće na ulicama Sofije zbog skorog uvođenja eura: prosvjedi prerasli u sukobe s policijom
Demonstranti u bugarskoj prijestolnici napali su policiju kamenjem i pirotehnikom, prosvjedujući protiv proračuna i prelaska na euro 1. siječnja.
By European Parliament from EU - New ECB Chief Lagarde to address plenary for first time, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=96224562

min čitanja

Više

Nogomet

FIFA u subotu otkriva kompletan raspored SP-a 2026.
U Washingtonu se u petak održava ždrijeb skupina za SP 2026., a dan kasnije FIFA uživo otkriva detaljan raspored svih 104 utakmice.

min čitanja

Više

Biznis

Bruxelles odobrio sedmi hrvatski zahtjev: stiže još 1,1 milijarda eura za reforme i ulaganja
Europska komisija potvrdila je da je Hrvatska ispunila svih 22 etape i 31 cilj za sedmu tranšu sredstava iz Nacionalnog plana oporavka i otpornosti, vrijednu 1,1 milijardu eura.

min čitanja

Više

Nogomet

Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542

Dinamo uz golmana manje slomio Goricu i zasjeo na vrh HNL-a
Monsef Bakrar i Marko Soldo presudili Gorici, a Dinamo je s igračem manje obranio vodstvo i preuzeo vrh prvenstvene ljestvice.

min čitanja

Više

Najnovije

Politika

Nizozemski kralj u Surinamu: „Nećemo bježati od pitanja ropstva”

Politika

Broj zaposlenih osoba s invaliditetom u tri godine udvostručen, slijede nove potpore poslodavcima

Vijesti

Stručnjaci upozoravaju na uspon „prevarantskih država” u jugoistočnoj Aziji

Vijesti

Francuski srebrnjaci iz križarskog doba otkriveni u Baranji blistaju u Osijeku

Vijesti

E-mailovi upozoravali na psihički slom osumnjičenog za pucnjavu na pripadnike Nacionalne garde

Vijesti

Portreti obrane: Osječki veterani pokrenuli potragu za imenima 3.000 pripadnika 106. brigade

Sport

Modrić se prisjetio dolaska u Real: „Cristiano je rekao – napokon si došao”

Vijesti

Pijan sletio s ceste kod Ražina i prevrnuo automobil

Vijesti

WHO uvjetno preporučio GLP-1 lijekove za liječenje pretilosti

Vijesti

Katalonske školjke otkrivaju zvuk star 6 000 godina