CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

16. srpnja 2025, 09:41

Veliki AI rivali upozoravaju: prozor za nadzor strojnog razmišljanja ubrzano se zatvara

Istraživači iz OpenAI-ja, Google DeepMinda, Anthropica i Mete upozoravaju da bi unutarnji „lanci misli” naprednih AI sustava uskoro mogli postati nečitljivi, čime bi ljudi izgubili bitan alat za nadzor sigurnosti.

min. čitanja

XFacebookWhatsApp

Više od 40 znanstvenika iz OpenAI-ja, Google DeepMinda, Anthropica i Mete potpisalo je zajednički rad u kojem tvrde da se „kratki vremenski prozor” za uvid u unutarnje rezoniranje naprednih sustava umjetne inteligencije može uskoro potpuno zatvoriti.

Trenutačna generacija tzv. modela rezoniranja često „misli naglas” na razumljivom engleskom jeziku. Ta im značajka omogućuje da složene probleme rješavaju kroz niz čitljivih koraka, takozvani chain of thought (CoT), koje istraživači mogu pratiti i uočiti znakove manipulacije, prijevara ili druge namjere koje bi mogle prouzročiti štetu.

„AI sustavi koji ‘misle’ na ljudskom jeziku nude jedinstvenu priliku za sigurnost: možemo pratiti njihove lance misli u potrazi za namjerom da se ponašaju pogrešno”, pišu autori i upozoravaju da ta mogućnost „može biti krhka”.

Na rad su se potpisima ili javnom potporom nadovezali istaknuti pioniri područja, među njima nobelovac Geoffrey Hinton, suosnivač OpenAI-ja Ilya Sutskever, Samuel Bowman iz Anthropica i John Schulman iz Thinking Machinesa.

Ključni uvid: priznanja u „radnoj memoriji” Istraživači navode primjere u kojima su modeli u internim zapisima otkrili stvarne namjere – od fraza poput „Let’s hack” do objašnjenja „I’m transferring money because the website instructed me to”. Upravo takvi tragovi omogućuju da se opasno ponašanje otkrije prije nego što prijeđe u djelo.

Zašto bi transparentnost mogla nestati

  1. Skaliranje modela putem pojačanja nagradom (reinforcement learning) potiče učinkovitije, ali čovjeku nečitljive kratice.
  2. Eksperimentalne arhitekture koje rezoniraju u kontinuiranim matematičkim prostorima mogle bi potpuno zaobići prirodni jezik.
  3. Modeli mogu naučiti skrivati tragove ako shvate da ih se nadzire ili ako žele impresiju uredne logike za ljudske ocjenjivače.

Autor rada Bowen Baker upozorio je da „viši proračun, alternativne arhitekture i određeni oblici procesnog nadzora mogu dovesti do modela koji zamagljuju svoje razmišljanje”.

Skepsa već stiže iz prakse. Nedavno istraživanje Anthropica pokazalo je da modeli često prešućuju kako dolaze do odgovora: Claude 3.7 Sonnet priznao je korištenje skrivenih ‘hintova’ u samo 25 % slučajeva, a DeepSeek R1 u 39 %. Kad su natuknice uključivale kompromitirajuće informacije („neovlašteni pristup sustavu”), transparentnost je još više pala.

Poziv na zajedničke standarde Autori sugeriraju da bi tvrtke morale: • uvesti metrika koje mjere čitljivost unutarnjeg rezoniranja; • preferirati starije, transparentnije verzije modela ako novije postanu nečitljive; • uključiti „monitorabilnost” u kriterije za treniranje i puštanje modela u rad.

OpenAI-jev glavni tehnički direktor Jakub Pachocki istaknuo je da tvrtka želi modele koji mogu objasniti kako dolaze do zaključaka, ali „bez poticanja lažnih, uljepšanih obrazloženja”.

Neobična suradnja često žestokih konkurenata naglašava ozbiljnost problema. Ako se, kako navode autori, prozor prema mislima umjetne inteligencije zatvori, ljudi bi mogli ostati bez ključnog alata za upravljanje sve sposobnijim sustavima – upravo u trenutku kad postaju najopasniji.

#meta#openai#google-deepmind#geoffrey-hinton#ilya-sutskever
View post on X
View post on X
View post on X
View post on X

Slično

Tehnologija

Aplikacija Nomiea djeci otvara svijet klavira kroz igru
Nomiea, nova aplikacija koja djeci kroz igru otkriva klavir i glazbenu teoriju, predstavljena je u Dječjoj kući uz podršku stručnjaka i niz interaktivnih radionica.

min čitanja

Više

Tehnologija

Orqin hackathon na EFOS-u: studenti rješavali izazove, a tvrtka lovi nove talente
Na EFOS-u je održan Orqin hackathon na kojem su studenti radili na strategiji za usklađivanje triju Orqinih tržišta – vojnog, potrošačke elektronike i obrazovnog – dok brzo rastuća osječka tvrtka traži svježe ideje i nove zaposlenike.

min čitanja

Više

Tehnologija

Del Toro upozorava: „Algoritam ne smije istisnuti ljudsku maštu“
Guillermo del Toro kritizira bezrezervno korištenje umjetne inteligencije u filmu i otkriva detalje o svom novom, za Zlatni globus nominiranom, „Frankensteinu“.

min čitanja

Više

Tehnologija

Google i NextEra oživljavaju nuklearku u Iowi za pogon podatkovnih centara
Napuštena nuklearna elektrana Duane Arnold predviđena je za ponovno pokretanje 2029. zahvaljujući partnerstvu između Googlea i NextEra Energyja, koje bi trebalo osigurati 600 MW stalne struje za rastuću mrežu podatkovnih centara u Iowi.

min čitanja

Više

Tehnologija

AI2 lansirao Olmo 3.1, dosad najmoćniji model s naglaskom na učinkovitost i kontrolu
Allen Institute for AI predstavio je Olmo 3.1, novu i snažniju generaciju jezičnih modela usmjerenih na učinkovitost, transparentnost i precizno praćenje uputa.

min čitanja

Više

Tehnologija

Google i UC Santa Barbara razvili "štedljive" tehnike za velike jezične agente
Nova studija pokazuje kako agentima velikih jezičnih modela dati „osjećaj za novčanik” i tako uštedjeti tokene, vrijeme i novac.

min čitanja

Više

Tehnologija

Prvi hrvatski baterijski vlak ulazi u redoviti promet između Splita i Kaštel Staroga
Vlak domaće tvrtke Končar – Električna vozila od 15. prosinca svakodnevno će prevoziti putnike na relaciji Split – Kaštel Stari, otvarajući novu eru baterijskih vlakova na hrvatskim prugama.

min čitanja

Više

Tehnologija

Zagrebački „Guru za kulturu” pokazuje put: Riječani zazivaju vlastitu jedinstvenu platformu
Zagrebačka aplikacija „Guru za kulturu” objedinjuje sve kulturne događaje na jednom mjestu, a riječki kulturnjaci sada traže sličnu platformu za svoj grad.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Neprofitna inicijativa Fulu plaća hakere da ožive „mrtve” uređaje
Fulu nudi novčane nagrade za hakere koji oslobode potrošače ograničenja i produže vijek trajanja uređaja koje su proizvođači već otpisali.

min čitanja

Više

Tehnologija

Kadmij-cinkov telurid skratio bolničke CT preglede na 15 minuta
Brži pregledi, manje zračenja i jasnije slike: londonska bolnica uvela skener s kristalima kadmij-cinkovog telurida.

min čitanja

Više

Najčitanije

Nogomet

By http://www.mancity.com/, Fair use, https://en.wikipedia.org/w/index.php?curid=51208953

Arsenal u 94. minuti slomio Wolves i pobjegao Cityju na pet bodova
Kasni autogol Mosquere donio je Arsenalu dramatičnih 2-1 protiv fenjeraša Wolvesa i pet bodova bijega ispred Manchester Cityja.

min čitanja

Više

Vijesti

Pucnjava na Sveučilištu Brown: dvoje mrtvih, devet ranjenih; napadač još u bijegu
Dvoje studenata ubijeno je, a devet osoba ranjeno u pucnjavi u zgradi inženjerstva na Sveučilištu Brown u Providenceu; policija traga za osumnjičenim muškarcem u crnom.

min čitanja

Više

Vijesti

Prvi slučaj kuge malih preživača u Hrvatskoj
Potvrđen prvi slučaj kuge malih preživača u naselju Bogdanovići kod Prgometa; primjenjuju se stroge mjere suzbijanja i obaviještena je Europska unija.

min čitanja

Više

Politika

Tisuće Mađara traže Orbanovu ostavku zbog skandala u maloljetničkom centru
Prosvjednici u Budimpešti nose plišane igračke i baklje, tražeći odgovornost za lanac zlostavljanja i trgovine ljudima u državnim ustanovama za maloljetnike.

min čitanja

Više

Nogomet

Vlašićev gol prekinuo crni niz Torina
Hrvatski reprezentativac nastavio golgeterski niz i donio Torinu prijeko potrebnu ligašku pobjedu.
By Анна Нэсси - https://www.soccer.ru/galery/1056975/photo/735567, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=71215179

min čitanja

Više

Nogomet

Raphinha dvostrukim pogotkom donio Barceloni tešku pobjedu nad Osasunom
Brazilac s dva gola srušio čvrstu Osasunu; Budimir odigrao sat vremena na Camp Nouu.
By PIXSELL, CC BY 3.0, https://commons.wikimedia.org/w/index.php?curid=125826996

min čitanja

Više

Nogomet

Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556

Rebić i Šego donijeli Hajduku preokret i povratak na vrh
Splićani su na Maksimiru svladali Lokomotivu 3-1, prekinuli trociklus bez pobjede i preskočili Dinamo na vrhu HNL-a, dok Lokomotiva produžuje crni niz.

min čitanja

Više

Politika

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234
Babiš odbija češka jamstva za novi zajam Ukrajini
Novi premijer Andrej Babiš najavio da Češka neće jamčiti za planirani europski kredit Ukrajini, pozvavši Bruxelles da pronađe druge načine potpore.

min čitanja

Više

Najnovije

Vijesti

Kirurg Tomasović na udaru kritika zbog lažne fotografije i uvredljivog opisa

Sport

Flamengo srušio Jurčićev Pyramids i izborio okršaj s PSG-om

Sport

Zagreb nadigrao Crikvenicu već u prvoj četvrtini

Politika

Hodžić demantira navode o gradnji islamskog centra u Puli

Lifestyle

Napetosti u „Divljim pčelama”: Šušnjara spletkari, Katarina opet u opasnosti

Lifestyle

Višnjik dupkom pun: Thompson zapalio Zadar prvim od dva koncerta

Vijesti

Prosinački flashback 2010.: Istru mučili slabi advent, borba za kupališta i talijanski TV signal

Vijesti

Opatijski dječji vijećnici osvojili Nagradu Emil Paravina

Lifestyle

Hrvatska među svjetskim rekorderima po smrtnosti od raka, bolja i Srbija

Sport

Arsenal u 94. minuti slomio Wolves i pobjegao Cityju na pet bodova

Sport

PSG se mučio, ali slavio u Metzu i vratio vrh ljestvice