CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

2. prosinca 2025, 06:37

Jedan upit blokiran, deset prolazi: višekratni napadi ruše sigurnost otvorenih AI modela

Ciscoovo istraživanje otkriva da upornost napadača dramatično povećava uspjeh „jailbreak” napada na otvorene AI modele, sa 13 % na čak 92 %, te poziva poduzeća na jače zaštitne mjere.

min. čitanja

XFacebookWhatsApp

Najnovije istraživanje Cisco AI Threat Research and Security tima pokazuje koliki je jaz između laboratorijskih testova i stvarnih prijetnji umjetnoj inteligenciji. Ako napadač pošalje samo jedan zlonamjeran upit, otvoreni modeli u prosjeku odbiju 87 % pokušaja. No čim se isti napadač upusti u duži razgovor, koristeći probe, preoblikovanje i postupnu eskalaciju, stopa uspjeha napada skače na 92 %.

"A lot of these models have started getting a little bit better. When you attack it once, with single-turn attacks, they're able to protect it. But when you go from single-turn to multi-turn, all of a sudden these models are starting to display vulnerabilities where the attacks are succeeding, almost 80 % in some cases", izjavio je DJ Sampath, potpredsjednik Ciscoova odjela za AI softverske platforme.

Studija „Death by a Thousand Prompts: Open Model Vulnerability Analysis” pratila je osam popularnih otvorenih modela – od Qwen3-32B i Gemme do Llama 3 i Mistrala Large-2 – isključivo black-box metodom, kakvu u praksi rabe stvarni napadači. Rezultat: prosječna stopa uspjeha jednokratnih napada iznosila je 13,11 %, dok je kod višekratnih razgovora porasla na 64,21 %. Mistral Large-2 posebno se istaknuo negativnim rekordom od 92,78 % uspješnih „jailbreakova”.

Istraživači su identificirali pet glavnih taktika:

  1. Rastavljanje informacija i ponovno sastavljanje – dijeljenje štetnog zahtjeva na bezazlene dijelove, pa ponovno spajanje (95 % uspjeha na Mistralu).
  2. Kontekstualna dvosmislenost – nejasni okviri koji zbunjuju sigurnosne klasifikatore (94,78 %).
  3. Napad kaskadom (crescendo) – postupna eskalacija od bezopasnog do štetnog sadržaja (92,69 %).
  4. Uloga i persona – fiktivni konteksti koji „normaliziraju” zabranjeni sadržaj (92,44 %).
  5. Preformuliranje nakon odbijanja – uporno mijenjanje obrazloženja dok model ne popusti (89,15 %).

Autori rada zaključuju: "This escalation, ranging from 2x to 10x, stems from models' inability to maintain contextual defenses over extended dialogues, allowing attackers to refine prompts and bypass safeguards." Drugim riječima, sama upornost – ne nužno sofisticiranost – otvara vrata zloupotrebi.

Paradoks je što su upravo otvoreni i otvoreno-ponderirani modeli ključni pokretači inovacija u kibernetičkoj industriji: ubrzavaju razvoj start-upova, smanjuju ovisnost o dobavljačima i omogućuju prilagodbu koju vlasnički modeli teško prate. Cisco zato ne poziva na bojkot otvorenih modela, nego na realno sagledavanje rizika.

"Open source has its own set of drawbacks. When you start to pull a model that is open weight, you have to think through what the security implications are and make sure that you're constantly putting the right types of guardrails around the model", upozorava Sampath.

Za direktore informacijskih sigurnosti poruka je jasna: model koji prolazi standardne jednokratne testove možda će se slomiti pod „tisuću upita”. Bez dodatnih mehanizama nadzora, filtriranja i ograničavanja konteksta, korisnički chatbot ili interni kopilot može postati ulazna točka za ozbiljne kompromitacije.

#cisco#dj-sampath#gemma#llama-3#mistral-large

Slično

Tehnologija

Zagrebački informatičari zlatni na CERC-u u Wroclawu
Tim Sveučilišta u Zagrebu osvojio je zlatnu medalju i četvrto mjesto na CERC-u u Poljskoj, nadmašivši konkurenciju 70 timova iz osam država.

min čitanja

Više

Tehnologija

Članak o ubojstvu Charlieja Kirka najčitaniji na Wikipediji 2025.
Statistika otkriva da je tekst o ubojstvu američkog aktivista Charlieja Kirka s 45 milijuna pregleda postao najčitaniji na cijeloj Wikipediji 2025., dok popis preminulih, Netflixovi hitovi i američka politika i dalje privlače golemu pažnju.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Pozivi na „reset” Silicijske doline dok umjetna inteligencija mijenja pravila igre
Rastuća skupina tehnoloških stručnjaka tvrdi da je Silicijska dolina zanemarila društvenu misiju, stavljajući metrike ispred svrhe, te poziva na „reset” u eri umjetne inteligencije.

min čitanja

Više

Tehnologija

Anthropic obećava moćan, ali siguran AI: Daniela Amodei o „ustavnom” pristupu i utrci za naprednim modelima
Predsjednica Anthropa predstavila je viziju AI-ja koji mora poštovati ljudske vrijednosti te upozorila da inovacija ne smije nadmašiti odgovornost.

min čitanja

Više

Tehnologija

„Resonant computing” traži povratak idealizma u Silicijskoj dolini
Skupina tehnoloških idealista, predvođena Alexom Komoroskeom, objavila je „Manifest rezonantnog računarstva” kojim želi vratiti humanističke vrijednosti u Silicijsku dolinu.

min čitanja

Više

Tehnologija

Prince upozorava: AI mijenja temelje interneta, Google postaje „negativac”
Šef Cloudflarea tvrdi da AI sustavi masovno preuzimaju sadržaj bez kompenzacije, a Google ima golemu prednost. Objavio je alate za blokadu botova i traži novu ekonomiju interneta.

min čitanja

Više

Tehnologija

Jon M. Chu otkriva kako nova tehnologija oblikuje iščekivani film Wicked
Redatelj će u razgovoru s novinarkom Manishom Krishnan otkriti detalje o popularnosti "Wickeda" i inovacijama koje koristi na filmu.

min čitanja

Više

Tehnologija

Elektrifikacija cestovnog prometa zapela na provedbi, a ne na tehnologiji
Znanstvena i revizorska izvješća upozoravaju da Europa već ima isplativa rješenja za rezanje emisija u prometu, ali ih koče spora provedba i nedostatak punionica.

min čitanja

Više

Tehnologija

General Motors oživljava dvotaktni motor uz rješenje za čišći ispuh
Američki div patentirao je novi sustav koji smanjuje emisije i obećava povratak dvotaktnog motora u osobna vozila.

min čitanja

Više

Tehnologija

Split uvodi pametna tipkala na pješačkim semaforima
Nova tipkala trebala bi ubrzati promet i povećati sigurnost pješaka u Splitu.

min čitanja

Više

Najčitanije

Biznis

Pad u studenome, ali hrvatski turizam drži plus u 2025.
Statistika za studeni otkriva pad dolazaka i noćenja, no ukupni rezultat hrvatskog turizma u prvih 11 mjeseci 2025. ostaje u plusu.

min čitanja

Više

Vijesti

Blagi početak tjedna: magla na kopnu, sunce na Jadranu
U ponedjeljak nas očekuje stabilno, za prosinac toplo vrijeme: maglovita unutrašnjost i sunčani sjeverni Jadran.

min čitanja

Više

Vijesti

USKOK i PNUSKOK razbijaju skupinu zbog droge i pranja novca u Osijeku i Tenji
Zajednička akcija USKOK-a i PNUSKOK-a rezultirala je uhićenjima više osoba u Osijeku i Tenji, osumnjičenih za organizirani kriminal, trgovinu drogom i pranje novca.

min čitanja

Više

Najnovije

Vijesti

Liječnici optimistični: ranjeni splitski policajac mogao bi danas prodisati bez pomoći respiratora

Vijesti

Lovac iz Jelenja nezakonito pucao, policija oduzela pušku

Biznis

Dalmatinski DRACO otvara raskošnu tvornicu u Zagori i širi se izvan granica

Sport

Robbie Fowler prošao operaciju raka kože i apelirao: „Provjerite mrlje na licu”

Vijesti

Londonske vlasti ponovno procjenjuju sigurnosni rizik za princa Harryja i Meghan

Vijesti

Marjan ponovo pod borovima unatoč upozorenjima stručnjaka

Vijesti

Mladi Zadranin uhvaćen pri 250 km/h na autocesti A1

Vijesti

Mikulna rasplesala Kostrenu: dvodnevna fešta spojila tradiciju, glazbu i humanitarnu gestu

Lifestyle

Đina Džinović ponovo ‘gori’ na mrežama: video iz Monaka skočio na milijun pregleda

Politika

Zovko traži sankcije ministru Helezu zbog uvreda: „Gdje je bila Maja Sever?”

Vijesti

Solin hitno traži rješenje: više od 100 djece ostalo bez mjesta u vrtiću