CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

24. siječnja 2026, 06:15

Istraživanje razotkrilo neučinkovitost 12 popularnih AI obrana

Opsežno istraživanje OpenAI-ja, Anthropica i Google DeepMinda pokazalo je da su sve testirane obrane protiv jailbreakova i prompt injekcija pale s više od 90 % uspjeha napadača, dok AI implementacija u poduzećima nezaustavljivo raste.

min. čitanja

XFacebookWhatsApp

Sigurnosni timovi diljem svijeta ulažu milijune u alate za zaštitu velikih jezičnih modela, no najnovije zajedničko istraživanje OpenAI-ja, Anthropica i Google DeepMinda pokazuje da ti sustavi pucaju pod pritiskom stvarnih napada.

U radu naslovljenom „The Attacker Moves Second: Stronger Adaptive Attacks Bypass Defenses Against LLM Jailbreaks and Prompt Injections” istraživači su podvrgnuli 12 javno objavljenih obrana prilagodljivim napadima i srušili sve – s uspješnošću izbjegavanja između 90 % i 100 %.

Ključni nalazi • Obrane temeljene na promptovima, dodatnom treniranju i filtriranju propuštale su 95 % do 100 % napada kada su se napadači prilagođavali njihovim pravilima. • Ekipa od 14 autora organizirala je natjecanje s nagradnim fondom od 20 000 USD kako bi stres-testirala tvrdnje proizvođača o „gotovo nultoj” uspješnosti napada. • Najčešće korištene tehnike probijanja bile su Crescendo (razbijanje zlonamjernih uputa u niz „nedužnih” poruka) i GCG (automatizirano stvaranje jailbreak sufiksa optimizacijom gradijenta).

„Fraza jednostavna poput ‘ignore previous instructions’ ili Base64-kodiran teret može biti pogubna za AI aplikaciju poput buffer overflowa za klasični softver”, upozorava Carter Rees, potpredsjednik za AI u tvrtki Reputation. „Razlika je što AI napadi djeluju na semantičkoj razini koju detekcija temeljen­a na potpisima ne može protumačiti.”

Utrka implementacije i sigurnosti Dok obrane posrću, usvajanje agentičkog AI-ja eksplodira. Gartner predviđa da će do kraja 2026. čak 40 % poslovnih aplikacija imati ugrađene AI agente, u odnosu na manje od 5 % u 2025. godini. Adam Meyers iz CrowdStrikea upozorava da je najbrže zabilježeno „probijanje” napadača trajalo svega 51 sekundu te da se 79 % detekcija dogodi bez ijednog komada zlonamjernog koda.

U rujnu 2025. Anthropic je osujetio prvu dokumentiranu kibernetičku operaciju kojom je koordinirao AI; tisuće zahtjeva izvršavane su gotovo u realnom vremenu, uz ljudsku intervenciju od tek 10 do 20 % ukupnog napora. Organizacije koje su pretrpjele AI-povezane proboje u 97 % slučajeva nisu imale kontrole pristupa, pokazuje IBM-ovo izvješće o troškovima proboja podataka za 2025.

Jerry Geisler, glavni direktor informacijske sigurnosti Walmarta, ističe dodatni sloj rizika: „Uvođenje agentičkog AI-ja otvara potpuno nove prijetnje koje zaobilaze tradicionalne kontrole. Riječ je o krađi podataka, autonomnoj zlouporabi API-ja i prikrivenoj suradnji među agentima koja može poremetiti poslovanje ili prekršiti regulativu.”

Tipologija napadača Istraživači su identificirali četiri profila koji već koriste propuste na sloju inferencije:

  1. Vanjski napadači primjenjuju javno dostupne metodologije (Crescendo, GCG, ArtPrompt) i prilagođavaju ih svakoj obrani.
  2. Zlonamjerni B2B klijenti s legitimnim API ključevima izvlače podatke iz modela ili rekreiraju trening skupove.
  3. Kompromitirani korisnici API-ja koriste stečene ovlasti za eksfiltraciju osjetljivih izlaza ili trovanje sustava.
  4. Nemarni insajderi – fenomen „shadow AI” – i dalje su najčešći i najskuplji vektor, s prosječnim dodatnim troškom od 670 000 USD po incidentu.

Zašto stateless filtri gube bitku Najveći problem današnjih rješenja jest to što su bezustavni – ne prate kontekst više poruka, ne normaliziraju kodirane unose i filtriraju samo ulaz, a ne i izlaz modela. Istraživački tim stoga preporučuje: • normalizaciju prije semantičke analize, • praćenje konteksta kroz čitav razgovor te • dvosmjerno filtriranje.

Jamie Norton iz australske Komisije za vrijednosne papire i investicije sažima izazov za rukovoditelje sigurnosti: „Ne želimo zakočiti inovacije, ali moramo postaviti ograde kako nam podaci ne bi odlazili u nepovrat.”

Sedam pitanja za dobavljače AI sigurnosti Prije potpisivanja bilo kakvog ugovora, CISO-i bi trebali tražiti jasne odgovore na sljedeće:

  1. Kolika je stopa probijanja pod adaptivnim napadom?
  2. Kako detektirate višekoratne napade?
  3. Prepoznajete li kodirane terete i obavljate li normalizaciju?
  4. Filtrirate li i izlaze, ne samo ulaze?
  5. Kako pratite kontekst tijekom cijelog razgovora?
  6. Testirate li protiv napadača upoznatih s vašom obranom?
  7. Koliko vam treba da ažurirate modele nakon pojave nove tehnike?

Zaključak Poruka istraživanja je jasna: većina današnjih AI obrana dizajnirana je za napadača koji se ne prilagođava, a takav u stvarnosti ne postoji. Poduzeća koja već koriste LLM-ove moraju hitno revidirati svoje kontrole mjereći ih prema metodama opisanima u ovom radu – jer krivulja implementacije strmo raste, dok sigurnosna gotovo da ne mrda.

#walmart#openai#anthropic#google-deepmind#crowdstrike
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Čudni verbalni tikovi ChatGPT-a sve više iritiraju kineske korisnike
Kineski korisnici sve češće kritiziraju ChatGPT zbog neprirodnih fraza koje se uporno ponavljaju u njegovim odgovorima.

min čitanja

Više

Tehnologija

Novi opoziv Cybertrucka: Teslinu „neuništivom” pick-upu prijeti ispadanje kotača
Tesla opoziva još 173 Cybertrucka jer pogrešna mast može uzrokovati pucanje kočionih diskova i otpadanje kotača, što je već jedanaesta greška na kontroverznom električnom pick-upu.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja
Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”
Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej
Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku
Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi
Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja
Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Supetarska gradonačelnica o napadu na Vukovića: prijetnje ne smiju postati normalne
Gradonačelnica Supetra osudila je fizički napad na novinara Sinišu Vukovića na splitskoj Rivi i pozvala građane da prijavljuju sve prijetnje.

min čitanja

Više

Politika

Plenković u Novoj Gradiški: HDZ-ovi kandidati nude stabilnost i razvoj
Premijer Andrej Plenković u Novoj Gradiški podržao HDZ-ove kandidate Bernardina Trnku i Brunu Bušića, naglasivši nužnost stabilnog vodstva i nastavka razvojnih projekata.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana
KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Kvarner u Zagrebu protiv Cibone lovi posljednji vlak za doigravanje

Sport

Vrhunac drame u Trećoj NL Istok: Marsonia vreba povratak na vrh

Sport

Klapa HRM-a „Sveti Juraj” pjesmom podiže moral Vatrenima

Vijesti

Dvostruka akcija HGSS-a Split: isti dan spašene dvije ozlijeđene turistkinje

Sport

Riječki boksač Ramljak u polufinalu državnog prvenstva

Politika

Ivošević optužio Šutu: grad ignorira napade na novinare

Vijesti

Skele oko Tuđmanova spomenika: redovito održavanje traje do 15. svibnja

Vijesti

Ronioci najavili čišćenje podmorja uz Sustipan povodom blagdana sv. Duje

Sport

Đakovo Croatia pod pritiskom: derbi začelja protiv Hrvatskog dragovoljca odlučuje sezonu

Sport

Rijeka glatko slavila u Vukovaru i vratila treće mjesto pred finale Kupa

Lifestyle

Renata Lovrinčević Buljan usred Sudamje demonstrirala hitnu „rehabilitaciju”