CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

20. listopada 2025, 14:28

Anthropic i američka vlada tvrde da su obuzdale nuklearne ambicije chatbotova

Startup Anthropic i američke nuklearne vlasti hvale se filtrom koji sprječava chatbotove da odaju tajne o izradi atomskog oružja, no stručnjaci sumnjaju u stvarne dosege i traže veću transparentnost.

min. čitanja

XFacebookWhatsApp

Američki startup Anthropic objavio je da je u suradnji s Ministarstvom energetike (DOE) i Nacionalnom upravom za nuklearnu sigurnost (NNSA) naučio svoj chatbot Claude da „ne dijeli nuklearne tajne”.

Tvrtka je, koristeći Amazonove cloud-servere najvišeg stupnja tajnosti, dopustila državnim stručnjacima da mjesecima "red-teamaju" (traže propuste) eksperimentalne verzije modela. Marina Favaro iz Anthropica objašnjava: „We deployed a then-frontier version of Claude in a Top Secret environment so that the NNSA could systematically test whether AI models could create or exacerbate nuclear risks.”

Rezultat tog testiranja je takozvani „nuklearni klasifikator” – sofisticirani filtar koji prepoznaje osjetljive teme i prekida razgovore koji bi mogli voditi prema izradi oružja. Popis rizičnih termina sastavila je NNSA, a iako je kontroliran, nije povjerljiv pa ga, kaže Favaro, mogu primijeniti i druge tvrtke. „It catches concerning conversations without flagging legitimate discussions about nuclear energy or medical isotopes.”

Skeptici traže više detalja

Dio stručnjaka ne dijeli oduševljenje. Oliver Stephenson iz Federacije američkih znanstvenika upozorava da današnji modeli možda i nisu prijetnja, ali "we don’t know where they’ll be in five years time … and it’s worth being prudent about that fact.” Smatra da bi Anthropic trebao jasnije opisati koje točno rizike klasifikator rješava i što se nalazi iza zida tajnosti.

Još je oštrija Heidy Khlaaf iz AI Now Institutea, koja podsjeća da Claude ionako nema pristup klasificiranom materijalu: „If the NNSA probed a model which was not trained on sensitive nuclear material, then their results are not an indication that their probing prompts were comprehensive, but that the model likely did not contain the data or training to demonstrate any sufficient nuclear capabilities.” Khlaaf dodaje da takve objave precjenjuju sposobnosti današnjih chatbotova i otvaraju pitanje treba li privatnim, slabo reguliranim kompanijama davati pristup vojnim podacima.

Odgovor iz Anthropica glasi: „A lot of our safety work is focused on proactively building safety systems that can identify future risks and mitigate against them.” Tvrtka je klasifikator ponudila besplatno konkurenciji u nadi da postane dobrovoljni industrijski standard.

Preciznost i pogreške

Iako je nuklearna tehnologija stara više od 80 godina, izrada oružja i dalje zahtijeva matematičku preciznost. Veliki jezikovni modeli poznati su po pogreškama u računanju, a podsjetnik na moguće posljedice je američki pokus iz 1954. kada je jedan matematički previd utrostručio snagu bombe.

Zasad, tvrde u Anthropicu i NNSA-i, Claude je zaštićen od takvih scenarija. No rasprava o tome je li riječ o pravoj sigurnosti ili samo „security theater” – tek je započela.

#claude#anthropic#ministarstvo-energetike-sad#federacija-americkih-znanstvenika#heidy-khlaaf

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Nizozemski regulator pokrenuo istragu protiv Robloxa zbog zaštite djece
ACM sumnja da popularna platforma ne poštuje odredbe DSA-a o sigurnosti maloljetnika i najavljuje moguću novčanu kaznu.

min čitanja

Više

Tehnologija

Kimi K2.5 izazvao buru: kineski tim na Redditu otkrio muke otvorenog koda
Trosatni AMA otkrio je skrivena lica najmoćnijeg otvorenog AI modela s fokusom na konkretne tehničke probleme i dilemu oko potpune otvorenosti.

min čitanja

Više

Tehnologija

Trgovci se okreću rubnom računalstvu za otpornije i brže poslovanje
Rubno računalstvo postaje ključan alat za trgovce koji se bore s višestrukim izazovima, od nestašice radnika do kibernetičkih prijetnji.

min čitanja

Više

Tehnologija

Hrvatski tim otkrio vezu kvara popravka genoma i ranog raka jetre
Istraživači pod vodstvom Ivana Đikića otkrili su kako genomski kvar potiče kroničnu upalu, rano starenje i razvoj karcinoma jetre.

min čitanja

Više

Tehnologija

Google tvrdi da umjetna inteligencija bolje rezonira kada u sebi vodi „društvo misli”
Googleovo istraživanje otkriva da LLM-ovi postižu bolje rezultate kad unutarnje simuliraju rasprave više "personâ", povećavajući kognitivnu raznolikost i smanjujući pristranost.

min čitanja

Više

Tehnologija

Identitet postaje glavna linija obrane: kako zaštititi autonomne agente u poduzećima
Salon o kibernetičkoj sigurnosti upozorava: uz odnos 45 strojnih prema jednom ljudskom identitetu, upravljanje privremenim ovlastima i sprečavanje eskalacije privilegija postaju ključan front obrane.

min čitanja

Više

Tehnologija

EU cyber chief: „We are losing this game, and we're losing massively”
Direktor ENISA-e Juhan Lepassaar upozorio je da EU gubi kibernetički rat te zatražio bitno veća ulaganja i radikalnu promjenu strategije.

min čitanja

Više

Tehnologija

Internet kognicije: Outshift predlaže kako da AI agenti konačno surađuju, a ne samo razmjenjuju poruke
Outshift, inovacijski ogranak Cisca, nudi koncept „Interneta kognicije” kako bi AI agenti dijelili namjeru i kontekst, a ne samo podatke.

min čitanja

Više

Tehnologija

Yann LeCun kreće u novu AI avanturu: „Svi su se navukli na LLM-ove, a to nije put do istinske inteligencije”
Nakon odlaska iz Mete, Yann LeCun najavljuje startup koji će, kaže, zaobići ograničenja velikih jezičnih modela i ponuditi drukčiji put prema umjetnoj općoj inteligenciji.

min čitanja

Više

Tehnologija

Maturanti uronili u laboratorije: Tehnički fakultet Rijeka otvara vrata budućim STEM stručnjacima
Dvodnevni DOL2026 okupio je 450 maturanata iz 13 škola, predstavio projekt vrijedan 840 tisuća eura i otvorio vrata najmodernijim STEM laboratorijima u Rijeci.

min čitanja

Više

Najčitanije

Politika

Jandroković: dolazak šefa OECD-a dokaz je da smo pred ulaskom u organizaciju
Šef Sabora najavio petkov susret s Mathiasom Cormannom i istaknuo jedinstvo koalicije oko Tomislava Ćorića za ministra financija.
European People's Party, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Najnovije

Politika

Frederiksen zaoštrava kurs: stranim kriminalcima ubrzane deportacije

Vijesti

HZMO poziva roditelje: zahtjev za dječji doplatak predajte do 1. ožujka

Politika

EK izdala šest opomena Hrvatskoj zbog kašnjenja u prenošenju direktiva

Politika

Šeik bin Zajed u Moskvi odjenuo Putinovu jaknu

Politika

Hrvatska pri dnu EU-a u korištenju fondova za borbu protiv raka

Biznis

Brod u hotelskom bazenu najavio 33. sajam nautike u Zagrebu

Lifestyle

Romske palače u Rumunjskoj: simbol moći kojem blijedi sjaj

Lifestyle

Žuta majica iz „Tajnog agenta” postala hit među brazilskim ljevičarima

Politika

Riječko Gradsko vijeće odbilo prijedlog o strožim mjerama protiv ustaških simbola

Biznis

Zaposlenica Ulinea dala otkaz uz optužbe na račun vlasnika: „Neću raditi za sponzore fašizma”

Vijesti

U Acehu izrečeno 140 udaraca bičem paru zbog preljuba i alkohola