CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

20. listopada 2025, 14:28

Anthropic i američka vlada tvrde da su obuzdale nuklearne ambicije chatbotova

Startup Anthropic i američke nuklearne vlasti hvale se filtrom koji sprječava chatbotove da odaju tajne o izradi atomskog oružja, no stručnjaci sumnjaju u stvarne dosege i traže veću transparentnost.

min. čitanja

XFacebookWhatsApp

Američki startup Anthropic objavio je da je u suradnji s Ministarstvom energetike (DOE) i Nacionalnom upravom za nuklearnu sigurnost (NNSA) naučio svoj chatbot Claude da „ne dijeli nuklearne tajne”.

Tvrtka je, koristeći Amazonove cloud-servere najvišeg stupnja tajnosti, dopustila državnim stručnjacima da mjesecima "red-teamaju" (traže propuste) eksperimentalne verzije modela. Marina Favaro iz Anthropica objašnjava: „We deployed a then-frontier version of Claude in a Top Secret environment so that the NNSA could systematically test whether AI models could create or exacerbate nuclear risks.”

Rezultat tog testiranja je takozvani „nuklearni klasifikator” – sofisticirani filtar koji prepoznaje osjetljive teme i prekida razgovore koji bi mogli voditi prema izradi oružja. Popis rizičnih termina sastavila je NNSA, a iako je kontroliran, nije povjerljiv pa ga, kaže Favaro, mogu primijeniti i druge tvrtke. „It catches concerning conversations without flagging legitimate discussions about nuclear energy or medical isotopes.”

Skeptici traže više detalja

Dio stručnjaka ne dijeli oduševljenje. Oliver Stephenson iz Federacije američkih znanstvenika upozorava da današnji modeli možda i nisu prijetnja, ali "we don’t know where they’ll be in five years time … and it’s worth being prudent about that fact.” Smatra da bi Anthropic trebao jasnije opisati koje točno rizike klasifikator rješava i što se nalazi iza zida tajnosti.

Još je oštrija Heidy Khlaaf iz AI Now Institutea, koja podsjeća da Claude ionako nema pristup klasificiranom materijalu: „If the NNSA probed a model which was not trained on sensitive nuclear material, then their results are not an indication that their probing prompts were comprehensive, but that the model likely did not contain the data or training to demonstrate any sufficient nuclear capabilities.” Khlaaf dodaje da takve objave precjenjuju sposobnosti današnjih chatbotova i otvaraju pitanje treba li privatnim, slabo reguliranim kompanijama davati pristup vojnim podacima.

Odgovor iz Anthropica glasi: „A lot of our safety work is focused on proactively building safety systems that can identify future risks and mitigate against them.” Tvrtka je klasifikator ponudila besplatno konkurenciji u nadi da postane dobrovoljni industrijski standard.

Preciznost i pogreške

Iako je nuklearna tehnologija stara više od 80 godina, izrada oružja i dalje zahtijeva matematičku preciznost. Veliki jezikovni modeli poznati su po pogreškama u računanju, a podsjetnik na moguće posljedice je američki pokus iz 1954. kada je jedan matematički previd utrostručio snagu bombe.

Zasad, tvrde u Anthropicu i NNSA-i, Claude je zaštićen od takvih scenarija. No rasprava o tome je li riječ o pravoj sigurnosti ili samo „security theater” – tek je započela.

#claude#anthropic#ministarstvo-energetike-sad#federacija-americkih-znanstvenika#heidy-khlaaf

Slično

Tehnologija

Aplikacija Nomiea djeci otvara svijet klavira kroz igru
Nomiea, nova aplikacija koja djeci kroz igru otkriva klavir i glazbenu teoriju, predstavljena je u Dječjoj kući uz podršku stručnjaka i niz interaktivnih radionica.

min čitanja

Više

Tehnologija

Orqin hackathon na EFOS-u: studenti rješavali izazove, a tvrtka lovi nove talente
Na EFOS-u je održan Orqin hackathon na kojem su studenti radili na strategiji za usklađivanje triju Orqinih tržišta – vojnog, potrošačke elektronike i obrazovnog – dok brzo rastuća osječka tvrtka traži svježe ideje i nove zaposlenike.

min čitanja

Više

Tehnologija

Del Toro upozorava: „Algoritam ne smije istisnuti ljudsku maštu“
Guillermo del Toro kritizira bezrezervno korištenje umjetne inteligencije u filmu i otkriva detalje o svom novom, za Zlatni globus nominiranom, „Frankensteinu“.

min čitanja

Više

Tehnologija

Google i NextEra oživljavaju nuklearku u Iowi za pogon podatkovnih centara
Napuštena nuklearna elektrana Duane Arnold predviđena je za ponovno pokretanje 2029. zahvaljujući partnerstvu između Googlea i NextEra Energyja, koje bi trebalo osigurati 600 MW stalne struje za rastuću mrežu podatkovnih centara u Iowi.

min čitanja

Više

Tehnologija

AI2 lansirao Olmo 3.1, dosad najmoćniji model s naglaskom na učinkovitost i kontrolu
Allen Institute for AI predstavio je Olmo 3.1, novu i snažniju generaciju jezičnih modela usmjerenih na učinkovitost, transparentnost i precizno praćenje uputa.

min čitanja

Više

Tehnologija

Google i UC Santa Barbara razvili "štedljive" tehnike za velike jezične agente
Nova studija pokazuje kako agentima velikih jezičnih modela dati „osjećaj za novčanik” i tako uštedjeti tokene, vrijeme i novac.

min čitanja

Više

Tehnologija

Prvi hrvatski baterijski vlak ulazi u redoviti promet između Splita i Kaštel Staroga
Vlak domaće tvrtke Končar – Električna vozila od 15. prosinca svakodnevno će prevoziti putnike na relaciji Split – Kaštel Stari, otvarajući novu eru baterijskih vlakova na hrvatskim prugama.

min čitanja

Više

Tehnologija

Zagrebački „Guru za kulturu” pokazuje put: Riječani zazivaju vlastitu jedinstvenu platformu
Zagrebačka aplikacija „Guru za kulturu” objedinjuje sve kulturne događaje na jednom mjestu, a riječki kulturnjaci sada traže sličnu platformu za svoj grad.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Neprofitna inicijativa Fulu plaća hakere da ožive „mrtve” uređaje
Fulu nudi novčane nagrade za hakere koji oslobode potrošače ograničenja i produže vijek trajanja uređaja koje su proizvođači već otpisali.

min čitanja

Više

Tehnologija

Kadmij-cinkov telurid skratio bolničke CT preglede na 15 minuta
Brži pregledi, manje zračenja i jasnije slike: londonska bolnica uvela skener s kristalima kadmij-cinkovog telurida.

min čitanja

Više

Najčitanije

Politika

Tisuće Mađara traže Orbanovu ostavku zbog skandala u maloljetničkom centru
Prosvjednici u Budimpešti nose plišane igračke i baklje, tražeći odgovornost za lanac zlostavljanja i trgovine ljudima u državnim ustanovama za maloljetnike.

min čitanja

Više

Nogomet

Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556

Rebić i Šego donijeli Hajduku preokret i povratak na vrh
Splićani su na Maksimiru svladali Lokomotivu 3-1, prekinuli trociklus bez pobjede i preskočili Dinamo na vrhu HNL-a, dok Lokomotiva produžuje crni niz.

min čitanja

Više

Politika

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234
Babiš odbija češka jamstva za novi zajam Ukrajini
Novi premijer Andrej Babiš najavio da Češka neće jamčiti za planirani europski kredit Ukrajini, pozvavši Bruxelles da pronađe druge načine potpore.

min čitanja

Više

Nogomet

Osječani i dalje u slobodnom padu, Gorica izdržala s igračem manje
Osijek je protiv Gorice odigrao samo 1-1 i ostao posljednji, iako je više od pola sata imao igrača više.

min čitanja

Više

Skijanje

Švicarska ofenziva u Val d’Isereu: Meillard slavio, Zubčić 24.
Švicarsko trostruko slavlje u veleslalomu Val d’Iserea, Meillard prvi, Zubčić 24.

min čitanja

Više

Vijesti

Pokušaj ubojstva u Velikoj Gorici: 26-godišnjak oštrim predmetom napao 21-godišnjakinju
Mladić (26) u Velikoj Gorici pokušao usmrtiti 21-godišnjakinju oštrim predmetom; žrtva zadobila lakše ozljede, napadač uhićen.

min čitanja

Više

Najnovije

Vijesti

Prvi slučaj kuge malih preživača u Hrvatskoj

Sport

Sopić ističe borbu za ostanak, Carević hvali hrabrost nakon remija Osijeka i Gorice

Sport

Lazio s devet igrača šokirao Parmu, isključen i Bašić

Sport

Požega najuspješnija prvog dana Dubrovnik Opena, domaćin uzeo četiri odličja

Politika

Vukušić prozvao Sarnavku zbog „dvostrukih standarda” u slučaju Ružice Ćavar

Sport

Split nastavio pobjednički niz, Vujičićev projektil donio dramu u Rijeci

Vijesti

Božić sunca i magle, prava zima možda tek krajem godine

Politika

Tisuće Mađara traže Orbanovu ostavku zbog skandala u maloljetničkom centru

Sport

Vlašićev gol prekinuo crni niz Torina

Sport

Brza razmjena golova na Maksimiru: Lokomotiva i Hajduk poravnati već nakon 20 minuta

Vijesti

Napad na policajku: slučaj marokanskog državljanina izazvao žestoke reakcije u Zadru