CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

2. prosinca 2025, 06:37

Jedan upit blokiran, deset prolazi: višekratni napadi ruše sigurnost otvorenih AI modela

Ciscoovo istraživanje otkriva da upornost napadača dramatično povećava uspjeh „jailbreak” napada na otvorene AI modele, sa 13 % na čak 92 %, te poziva poduzeća na jače zaštitne mjere.

min. čitanja

XFacebookWhatsApp

Najnovije istraživanje Cisco AI Threat Research and Security tima pokazuje koliki je jaz između laboratorijskih testova i stvarnih prijetnji umjetnoj inteligenciji. Ako napadač pošalje samo jedan zlonamjeran upit, otvoreni modeli u prosjeku odbiju 87 % pokušaja. No čim se isti napadač upusti u duži razgovor, koristeći probe, preoblikovanje i postupnu eskalaciju, stopa uspjeha napada skače na 92 %.

"A lot of these models have started getting a little bit better. When you attack it once, with single-turn attacks, they're able to protect it. But when you go from single-turn to multi-turn, all of a sudden these models are starting to display vulnerabilities where the attacks are succeeding, almost 80 % in some cases", izjavio je DJ Sampath, potpredsjednik Ciscoova odjela za AI softverske platforme.

Studija „Death by a Thousand Prompts: Open Model Vulnerability Analysis” pratila je osam popularnih otvorenih modela – od Qwen3-32B i Gemme do Llama 3 i Mistrala Large-2 – isključivo black-box metodom, kakvu u praksi rabe stvarni napadači. Rezultat: prosječna stopa uspjeha jednokratnih napada iznosila je 13,11 %, dok je kod višekratnih razgovora porasla na 64,21 %. Mistral Large-2 posebno se istaknuo negativnim rekordom od 92,78 % uspješnih „jailbreakova”.

Istraživači su identificirali pet glavnih taktika:

  1. Rastavljanje informacija i ponovno sastavljanje – dijeljenje štetnog zahtjeva na bezazlene dijelove, pa ponovno spajanje (95 % uspjeha na Mistralu).
  2. Kontekstualna dvosmislenost – nejasni okviri koji zbunjuju sigurnosne klasifikatore (94,78 %).
  3. Napad kaskadom (crescendo) – postupna eskalacija od bezopasnog do štetnog sadržaja (92,69 %).
  4. Uloga i persona – fiktivni konteksti koji „normaliziraju” zabranjeni sadržaj (92,44 %).
  5. Preformuliranje nakon odbijanja – uporno mijenjanje obrazloženja dok model ne popusti (89,15 %).

Autori rada zaključuju: "This escalation, ranging from 2x to 10x, stems from models' inability to maintain contextual defenses over extended dialogues, allowing attackers to refine prompts and bypass safeguards." Drugim riječima, sama upornost – ne nužno sofisticiranost – otvara vrata zloupotrebi.

Paradoks je što su upravo otvoreni i otvoreno-ponderirani modeli ključni pokretači inovacija u kibernetičkoj industriji: ubrzavaju razvoj start-upova, smanjuju ovisnost o dobavljačima i omogućuju prilagodbu koju vlasnički modeli teško prate. Cisco zato ne poziva na bojkot otvorenih modela, nego na realno sagledavanje rizika.

"Open source has its own set of drawbacks. When you start to pull a model that is open weight, you have to think through what the security implications are and make sure that you're constantly putting the right types of guardrails around the model", upozorava Sampath.

Za direktore informacijskih sigurnosti poruka je jasna: model koji prolazi standardne jednokratne testove možda će se slomiti pod „tisuću upita”. Bez dodatnih mehanizama nadzora, filtriranja i ograničavanja konteksta, korisnički chatbot ili interni kopilot može postati ulazna točka za ozbiljne kompromitacije.

#cisco#dj-sampath#gemma#llama-3#mistral-large
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi
Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete
Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Tehnologija

Kibernetički napad oborio Canvas i poremetio nastavu tisućama škola
Masovni pad platforme Canvas zbog napada grupe "ShinyHunters" poremetio je nastavu diljem SAD-a, a hakeri prijete objavom podataka više od 8 800 škola.

min čitanja

Više

Tehnologija

Kako ukloniti Gemini Nano iz Chromea i što time gubite
Googleov AI model Gemini Nano potajno zauzima 4 GB na računalima korisnika Chromea. Donosimo upute kako ga isključiti i koje sigurnosne značajke tada prestaju raditi.

min čitanja

Više

Tehnologija

Zašto par jeftinih žičanih slušalica vrijedi imati u putnoj torbi
Sezona putovanja vraća u fokus staru tehnologiju: evo zašto bi svatko trebao ubaciti jeftine žičane slušalice u prtljagu.

min čitanja

Više

Tehnologija

Apple u Velikoj Britaniji uvodi obveznu provjeru dobi na iPhoneu
Nakon ažuriranja iOS-a 26.4 Apple od britanskih korisnika traži dokaz da su stariji od 18 godina; u suprotnom iPhone automatski prelazi u dječji režim s ograničenim pristupom sadržaju.

min čitanja

Više

Tehnologija

Čudni verbalni tikovi ChatGPT-a sve više iritiraju kineske korisnike
Kineski korisnici sve češće kritiziraju ChatGPT zbog neprirodnih fraza koje se uporno ponavljaju u njegovim odgovorima.

min čitanja

Više

Najčitanije

Vijesti

Zatvara se dionica A8 kod Matulja zbog rušenja nadvožnjaka
Vikend 9.–10. svibnja donosi potpunu obustavu prometa između čvorova Veprinac i Matulji radi uklanjanja nadvožnjaka Jankovićeva cesta na A8.

min čitanja

Više

Vijesti

Zagreb obilježava Dan oslobođenja: vijenci na Mirogoju i Dotrščini, svečana akademija u Lisinskom
Gradonačelnik Tomašević predvodi komemoracije povodom 81. godišnjice oslobođenja Zagreba i Dana pobjede nad fašizmom.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Vijesti

Sinjski 21-godišnjak odbio test na droge pa završio iza rešetaka

Lifestyle

Kliofest premijerno u Poreču: povijest za sve, od statuta do rimske kuhinje

Vijesti

Srebro za Opatijku Saru Babić na državnom natjecanju WorldSkills Croatia

Biznis

Ina i MOL pregovaraju o povratku u Siriju

Vijesti

Šezdeset godina splitske nuklearne medicine

Biznis

Proizvođačke cijene u travnju snažno rasle, energenti glavni pokretač

Lifestyle

Poreč se pretvara u središte noćnog života nakon Vinistre

Biznis

Ina želi oživjeti sirijske bušotine, Damask proučavao LNG terminal na Krku

Politika

Širi se vrtić na Vrbanima: nova etaža donosi mjesta za još četiri skupine

Vijesti

Lesnina povlači Brabantia zaimaču za juhu zbog štetnih amina

Biznis

Jadrolinija zbog rasta troškova privremeno gasi liniju Split – Ancona