Tehnologija

20. listopada 2025, 14:28

Anthropic i američka vlada tvrde da su obuzdale nuklearne ambicije chatbotova

Startup Anthropic i američke nuklearne vlasti hvale se filtrom koji sprječava chatbotove da odaju tajne o izradi atomskog oružja, no stručnjaci sumnjaju u stvarne dosege i traže veću transparentnost.

min. čitanja

Američki startup Anthropic objavio je da je u suradnji s Ministarstvom energetike (DOE) i Nacionalnom upravom za nuklearnu sigurnost (NNSA) naučio svoj chatbot Claude da „ne dijeli nuklearne tajne”.

Tvrtka je, koristeći Amazonove cloud-servere najvišeg stupnja tajnosti, dopustila državnim stručnjacima da mjesecima "red-teamaju" (traže propuste) eksperimentalne verzije modela. Marina Favaro iz Anthropica objašnjava: „We deployed a then-frontier version of Claude in a Top Secret environment so that the NNSA could systematically test whether AI models could create or exacerbate nuclear risks.”

Rezultat tog testiranja je takozvani „nuklearni klasifikator” – sofisticirani filtar koji prepoznaje osjetljive teme i prekida razgovore koji bi mogli voditi prema izradi oružja. Popis rizičnih termina sastavila je NNSA, a iako je kontroliran, nije povjerljiv pa ga, kaže Favaro, mogu primijeniti i druge tvrtke. „It catches concerning conversations without flagging legitimate discussions about nuclear energy or medical isotopes.”

Skeptici traže više detalja

Dio stručnjaka ne dijeli oduševljenje. Oliver Stephenson iz Federacije američkih znanstvenika upozorava da današnji modeli možda i nisu prijetnja, ali "we don’t know where they’ll be in five years time … and it’s worth being prudent about that fact.” Smatra da bi Anthropic trebao jasnije opisati koje točno rizike klasifikator rješava i što se nalazi iza zida tajnosti.

Još je oštrija Heidy Khlaaf iz AI Now Institutea, koja podsjeća da Claude ionako nema pristup klasificiranom materijalu: „If the NNSA probed a model which was not trained on sensitive nuclear material, then their results are not an indication that their probing prompts were comprehensive, but that the model likely did not contain the data or training to demonstrate any sufficient nuclear capabilities.” Khlaaf dodaje da takve objave precjenjuju sposobnosti današnjih chatbotova i otvaraju pitanje treba li privatnim, slabo reguliranim kompanijama davati pristup vojnim podacima.

Odgovor iz Anthropica glasi: „A lot of our safety work is focused on proactively building safety systems that can identify future risks and mitigate against them.” Tvrtka je klasifikator ponudila besplatno konkurenciji u nadi da postane dobrovoljni industrijski standard.

Preciznost i pogreške

Iako je nuklearna tehnologija stara više od 80 godina, izrada oružja i dalje zahtijeva matematičku preciznost. Veliki jezikovni modeli poznati su po pogreškama u računanju, a podsjetnik na moguće posljedice je američki pokus iz 1954. kada je jedan matematički previd utrostručio snagu bombe.

Zasad, tvrde u Anthropicu i NNSA-i, Claude je zaštićen od takvih scenarija. No rasprava o tome je li riječ o pravoj sigurnosti ili samo „security theater” – tek je započela.

#claude #anthropic #ministarstvo-energetike-sad #federacija-americkih-znanstvenika #heidy-khlaaf

Slično

Tehnologija

Lažni video don Luke Klarice šokirao vjernike

Svećenik iz Splita demantirao deepfake snimku i upozorio vjernike na opasnosti lažnih iscjelitelja i zloupotrebe umjetne inteligencije.

min čitanja

Više

Tehnologija

Adobe predstavlja AI Foundry za dubinsko prilagođavanje Firefly modela poduzećima

Nova Adobeova usluga klijentima omogućuje „kirurško” pretreniravanje Fireflyja na njihovoj intelektualnoj imovini, a prvi su korisnici Home Depot i Walt Disney Imagineering.

min čitanja

Više

Tehnologija

Čip tanji od vlasi vraća vid: pacijenti ponovno čitaju knjige

Implantat Prima, veličine 2×2 mm i tanji od vlasi kose, vraća središnji vid oboljelima od makularne degeneracije; 84 % pacijenata ponovno čita tekst.

min čitanja

Više

Tehnologija

Ferrari SC40: moderna posveta legendarnom F40

Novi SC40 donosi 819 konjskih snaga i dizajnerske reference na F40, uz tajnovitu cijenu i izložbeni debi u Ferrarijevu muzeju.

min čitanja

Više

Tehnologija

AI mijenja STEM: statistika i podaci guraju kodiranje u drugi plan

Sve manje učenika želi studirati računalne znanosti, a sve više bira statistiku i podatkovnu analitiku. Škole i sveučilišta prilagođavaju kurikulum usponu umjetne inteligencije, potičući interdisciplinarnost i kritičko razumijevanje algoritama.

min čitanja

Više

Tehnologija

Tko bi bolje „savjetovao” Bruxelles: ChatGPT, Le Chat ili DeepSeek?

Eksperiment s tri vodeća chatbota otkriva kako bi AI savjetovala Ursulu von der Leyen o najosjetljivijim europskim pitanjima.

min čitanja

Više

Tehnologija

Globalni pad AWS-a srušio Amazon, Snapchat i Roblox

Milijuni korisnika ostali su bez pristupa popularnim aplikacijama zbog kvara na Amazonovoj cloud platformi AWS.

min čitanja

Više

Tehnologija

Kibernetički kriminal raste, a stručnjaka nema: EU i Hrvatska traže hitna rješenja

Broj kibernetičkih napada u stalnom je porastu, a Hrvatska i EU muče se s kroničnim nedostatkom stručnjaka za njihovo suzbijanje.

min čitanja

Više

Tehnologija

EU gradi „tvornice umjetne inteligencije”: Srbija dobiva centar, stručnjaci upozoravaju na dvostruke aršine

Bruxelles najavljuje dva centra umjetne inteligencije na Zapadnom Balkanu, od čega jedan u Srbiji, dok stručnjaci prozivaju Europsku komisiju zbog neusklađene politike prema Beogradu.

min čitanja

Više

Tehnologija

Bez pravilnog 'prvog dana' i umjetna inteligencija može zalutati

Tvrtke ubrzano uvode generativnu umjetnu inteligenciju, ali bez jasnog onboardinga modeli lutaju, halluciniraju i otvaraju pravne rizike. Stručnjaci zato traže da se prema AI-u postupa kao prema novom zaposleniku – s opisom posla, obukom, simulacijama i stalnim evaluacijama.

min čitanja

Više

Najčitanije

Vijesti

Kardinal Bozanić obilježio 50 godina svećeništva uz zahvale, ali i podsjetnik na osporavanja

Zagrebu je održana zlatna misa kardinala Bozanića: 50 godina svećeničke službe, papinska čestitka i osvrt na osporavanja tijekom nadbiskupske misije.

min čitanja

Više

Tenis

Alcaraz i Zverev predvode Španjolsku i Njemačku u završnici Davis Cupa

Svjetski brojevi jedan i tri, Alcaraz i Zverev, potvrđeni su za Final 8 Davis Cupa u Bologni; Španjolska igra s Češkom, Njemačka s Argentinom.

min čitanja

Više

Nogomet

FIFA opalila HNS-u 48.500 franaka globe zbog pirotehnike i utrčavanja

Disciplinska komisija FIFA-e kaznila je Hrvatski nogometni savez s 48.500 švicarskih franaka zbog pirotehnike u Pragu i utrčavanja u Varaždinu.

min čitanja

Više

Nogomet

Dembele i Marquinhos ponovno spremni, PSG po treću pobjedu u Ligi prvaka

Francuski prvak jači za dva ključna igrača uoči gostovanja kod Bayer Leverkusena.

min čitanja

Više

Tehnologija

20. listopada 2025, 14:28

Anthropic i američka vlada tvrde da su obuzdale nuklearne ambicije chatbotova

min. čitanja

Skeptici traže više detalja

Preciznost i pogreške

Zasad, tvrde u Anthropicu i NNSA-i, Claude je zaštićen od takvih scenarija. No rasprava o tome je li riječ o pravoj sigurnosti ili samo „security theater” – tek je započela.

#claude #anthropic #ministarstvo-energetike-sad #federacija-americkih-znanstvenika #heidy-khlaaf

Slično

Tehnologija

Lažni video don Luke Klarice šokirao vjernike

Svećenik iz Splita demantirao deepfake snimku i upozorio vjernike na opasnosti lažnih iscjelitelja i zloupotrebe umjetne inteligencije.

min čitanja

Više

Tehnologija

Adobe predstavlja AI Foundry za dubinsko prilagođavanje Firefly modela poduzećima

Nova Adobeova usluga klijentima omogućuje „kirurško” pretreniravanje Fireflyja na njihovoj intelektualnoj imovini, a prvi su korisnici Home Depot i Walt Disney Imagineering.

min čitanja

Više

Tehnologija

Čip tanji od vlasi vraća vid: pacijenti ponovno čitaju knjige

Implantat Prima, veličine 2×2 mm i tanji od vlasi kose, vraća središnji vid oboljelima od makularne degeneracije; 84 % pacijenata ponovno čita tekst.

min čitanja

Više

Tehnologija

Ferrari SC40: moderna posveta legendarnom F40

Novi SC40 donosi 819 konjskih snaga i dizajnerske reference na F40, uz tajnovitu cijenu i izložbeni debi u Ferrarijevu muzeju.

min čitanja

Više

Tehnologija

AI mijenja STEM: statistika i podaci guraju kodiranje u drugi plan

min čitanja

Više

Tehnologija

Tko bi bolje „savjetovao” Bruxelles: ChatGPT, Le Chat ili DeepSeek?

Eksperiment s tri vodeća chatbota otkriva kako bi AI savjetovala Ursulu von der Leyen o najosjetljivijim europskim pitanjima.

min čitanja

Više

Tehnologija

Globalni pad AWS-a srušio Amazon, Snapchat i Roblox

Milijuni korisnika ostali su bez pristupa popularnim aplikacijama zbog kvara na Amazonovoj cloud platformi AWS.

min čitanja

Više

Tehnologija

Kibernetički kriminal raste, a stručnjaka nema: EU i Hrvatska traže hitna rješenja

Broj kibernetičkih napada u stalnom je porastu, a Hrvatska i EU muče se s kroničnim nedostatkom stručnjaka za njihovo suzbijanje.

min čitanja

Više

Tehnologija

EU gradi „tvornice umjetne inteligencije”: Srbija dobiva centar, stručnjaci upozoravaju na dvostruke aršine

Bruxelles najavljuje dva centra umjetne inteligencije na Zapadnom Balkanu, od čega jedan u Srbiji, dok stručnjaci prozivaju Europsku komisiju zbog neusklađene politike prema Beogradu.

min čitanja

Više

Tehnologija

Bez pravilnog 'prvog dana' i umjetna inteligencija može zalutati

min čitanja

Više

Najčitanije

Vijesti

Kardinal Bozanić obilježio 50 godina svećeništva uz zahvale, ali i podsjetnik na osporavanja

Zagrebu je održana zlatna misa kardinala Bozanića: 50 godina svećeničke službe, papinska čestitka i osvrt na osporavanja tijekom nadbiskupske misije.

min čitanja

Više

Tenis

Alcaraz i Zverev predvode Španjolsku i Njemačku u završnici Davis Cupa

Svjetski brojevi jedan i tri, Alcaraz i Zverev, potvrđeni su za Final 8 Davis Cupa u Bologni; Španjolska igra s Češkom, Njemačka s Argentinom.

min čitanja

Više

Nogomet

FIFA opalila HNS-u 48.500 franaka globe zbog pirotehnike i utrčavanja

Disciplinska komisija FIFA-e kaznila je Hrvatski nogometni savez s 48.500 švicarskih franaka zbog pirotehnike u Pragu i utrčavanja u Varaždinu.

min čitanja

Više

Nogomet

Dembele i Marquinhos ponovno spremni, PSG po treću pobjedu u Ligi prvaka

Francuski prvak jači za dva ključna igrača uoči gostovanja kod Bayer Leverkusena.

min čitanja

Više