Anthropic je svoj najnapredniji model umjetne inteligencije, Claude Opus 4.6, usmjerio prema stvarnim otvorenim repozitorijima i pronašao više od 500 visokorizičnih propusta koji su godinama izmaknuli klasičnim skenerima i timovima stručnjaka. Petnaest dana nakon što je objavio rezultate istrage (5. veljače), startup je 20. veljače ponudio istu mogućnost u obliku novog proizvoda Claude Code Security, zasad u ograničenom istraživačkom izdanju za poslovne korisnike.
Za razliku od statičkih alata koji traže poznate obrasce ranjivosti, Claude „razmišlja” poput ljudskog istraživača: prati tok podataka kroz aplikaciju i detektira logičke greške i propuste u kontroli pristupa koje nijedno prethodno pravilo ne opisuje. U testovima je autonomno sastavljao dokaze koncepta za projekte poput GhostScripta, OpenSC-a i CGIF-a, pri čemu je za svaki koristio drugu strategiju zaključivanja.
„Prijelaz s prepoznavanja uzoraka na generiranje hipoteza predstavlja skokovito povećanje moći otkrivanja i zahtijeva jednako jake ljudske i tehničke kontrole”, istaknula je stručnjakinja za kibernetičku sigurnost Merritt Baer.
Proces validacije odvijao se u izoliranom virtualnom okruženju sa standardnim alatima, bez posebnih uputa ili skripti. Model je sam filtrirao, deduplicirao i prioritizirao nalaze prije nego što su ih preuzeli ljudski analitičari, a vanjski sigurnosni stručnjaci potvrdili i zakrpali ranjivosti. Ciljana su bila ključna otvorenokodna rješenja koje često održavaju volonteri, pa svaka dugogodišnja greška prelazi na mnoštvo komercijalnih proizvoda koji se na njih oslanjaju.
Claudeovo „razumijevanje koda” već je provjereno na natjecanjima: ušao je u gornjih 3 % sudionika PicoCTF-a, riješio 19 od 20 zadataka u HackTheBox-ovu AI vs Human CTF-u, te sudjelovao u obrani mreža na Western Regional CCDC-u. U partnerstvu s Pacific Northwest National Laboratoryjem, model je uspješno simulirao kompromitiranje uređaja u vodnom postrojenju za tri sata – zadatak koji inače traje tjednima.
Za sigurnosne odjele koji se oslanjaju isključivo na alate poput CodeQL-a, novo otkriće otvara neugodno pitanje: kako kombinirati obrasce i rezoniranje prije nego što to učine napadači? Budući da je Claude Code Security sada dostupan timovima i poduzećima, očekuje se da će uprave ubrzo tražiti odgovor – i proračun – za nadogradnju postojećih sustava skeniranja.