Najnoviji modeli umjetne inteligencije sve su bolji ne samo u pisanju koda, nego i u pronalaženju opasnih sigurnosnih rupa, pokazuje istraživanje Sveučilišta Berkeley. Tim profesorice Dawn Song testirao je niz naprednih AI modela i agenata na 188 velikih projekata otvorenog koda koristeći novi benchmark CyberGym. Rezultat: pronađeno je 17 novih pogrešaka, među kojima čak 15 dosad nepoznatih, tzv. zero-day ranjivosti.
„Many of these vulnerabilities are critical”, upozorava Song, dodajući da kombinacija sve boljih programerskih vještina modela i njihovog naprednog rezoniranja radikalno mijenja kibernetički krajolik. „This is a pivotal moment… It actually exceeded our general expectations.”
Eksperiment je obuhvatio komercijalne modele OpenAI-ja, Googlea i Anthropica, kao i otvorene opcije Mete, DeepSeeka i Alibabe, spojene s agentima poput OpenHandsa, Cybencha i EnIGMA-e. Modeli su najprije dobili opise poznatih ranjivosti kako bi pokušali ponovno otkriti pogreške u svježem kodu, a potom su samostalno tragali za novima. Generirali su stotine probnih exploit-koda, pri čemu su najbolja kombinacija – Claude i OpenHands – otkrili tek oko dva posto svih ranjivosti.
Unatoč tom ograničenju, industrija već sada vidi golemi potencijal. Startup Xbow razvio je AI alat koji se probio na vrh HackerOneove ljestvice lovaca na bugove i upravo je osigurao 75 milijuna dolara novog kapitala. Profesor Brendan Dolan-Gavitt s njujorškog sveučilišta Tandon i istraživač u Xbowu smatra da će AI povećati broj napada baziranih na zero-day propustima jer „there are very few people who have the expertise to find new vulnerabilities and build exploits for them”.
Na oprez poziva i veteranka sigurnosti Katie Moussouris iz Luta Securityja. Ističe da je istraživanje sjajno jer pokazuje koliko je ljudska stručnost i dalje nenadmašna: „Don’t replace your human bug hunters yet.” Više je zabrinjava, kaže, mogućnost da tvrtke pretjerano ulažu u AI nauštrb drugih sigurnosnih mjera.
Primjeri iz prakse potvrđuju rastuću moć alata. Stručnjak Sean Heelan uz pomoć OpenAI-jeva modela o3 otkrio je zero-day u Linux jezgru, a Googleov tim Project Zero lani je uz pomoć AI identificirao nepoznatu ranjivost. U zasebnom radu objavljenom u svibnju Song i suradnici izračunali su da bi AI agenti na programima nagrađivanja bugova mogli zaraditi desetke tisuća dolara; Claude Code pronašao je greške vrijedne 1 350 USD i dizajnirao zakrpe vrijedne 13 862 USD uz stotine dolara troška API-ja.
Istraživači su pokrenuli i AI Frontiers CyberSecurity Observatory, inicijativu za stalno praćenje moći različitih modela. U travanjskom blogu Song i kolege upozorili su da će „steadily improving models” kratkoročno više koristiti napadačima nego obrani, zbog čega postaje ključno pomno mjeriti njihove sposobnosti.
Hayden Smith iz tvrtke Hunted Labs naglašava važnost odgovornog prijavljivanja rupa jer će sve više ljudi uz pomoć AI-ja moći otkriti opasne propuste. Iako su trenutna ograničenja jasna, tempo napretka sugerira da je kibernetička sigurnost prvo područje u kojem bi umjetna inteligencija mogla postati pravi izazov – i prijetnja – globalno.