Tehnologija

Amodei najavio utrku za „proziran” AI: interpretabilnost kao adut Anthropica u sve žešćoj borbi laboratorija

Anthropic pojačava ulaganja u interpretabilnost svojih AI modela, tvrdeći da će to biti ključ sigurnijih i profitabilnijih sustava, dok stručnjaci upozoravaju da transparentnost sama po sebi nije dovoljna.

min čitanja

Od osnutka 2021., kada se sedmero zaposlenika OpenAI-ja odvojilo zbog zabrinutosti za sigurnost umjetne inteligencije, Anthropic gradi modele vođene vlastitim „Ustavom” – skupom načela čiji je cilj da sustavi budu „korisni, iskreni i bezopasni”. No izvršni direktor Dario Amodei sada tvrdi da to više nije dovoljno: "Naše nerazumijevanje unutarnjih mehanizama modela znači da ne možemo predvidjeti štetna ponašanja niti ih pouzdano spriječiti", upozorio je u travnju.

  1. Ključna riječ – interpretabilnost
    Anthropic je, za razliku od konkurenata poput Googleova Geminija 2.5 Pro ili OpenAI-jeva o3, istraživanje usmjerio na razumijevanje procesa „razmišljanja” modela. Cilj je da do 2027. „interpretabilnost pouzdano otkriva većinu problema”, što bi otvorilo vrata primjeni u financijama, medicini i pravu, gdje propisi traže objašnjene odluke.

  2. Tržišna utrka
    Njihov Claude 3.7 Sonnet dominirao je kodiranim testovima u veljači, a nova verzija Claude 4.0 Opus ponovila je uspjeh. Ipak, rivali ih nadmašuju u matematici, kreativnom pisanju i višestrukim jezicima. Amazon i Google već su uložili milijarde u Anthropic, videći potencijal u smanjenju troškova nadzora sustava koji se mogu „skenirati”.

  3. Nova ulaganja
    Anthropic je nedavno sudjelovao u 50 milijuna dolara vrijednom ulaganju u Goodfire i njegov alat Ember koji otkriva i manipulira „naučenim konceptima” unutar modela. Time priznaju da će za razvoj prozirnih sustava trebati čitav novi ekosustav alata i stručnjaka.

  4. Skepsa stručnjaka
    Istraživač sigurnosti AI-ja Sayash Kapoor podsjeća da „interpretabilnost nije srebrni metak”. Po njemu su jednako važni filtri, verifikatori i dizajn usmjeren na čovjeka. Ističe i „zabludu neprozirnosti” – ideju da se tehnologija ne može odgovorno koristiti bez potpune transparentnosti.

  5. Otvoreni pristup ili kontrola?
    Na konferenciji VivaTech u Parizu predsjednik Nvidije Jensen Huang osporio je Amodeijev naglasak na ograničenom razvoju: „Ako želite da nešto bude sigurno i odgovorno, radite to otvoreno.” Anthropic odgovara da Amodei zagovara „nacionalni standard transparentnosti” za sve laboratorije.

  6. Širi kontekst
    Google DeepMind, predvođen Neelom Nandom, paralelno ulaže u isti istraživački smjer. Zajednički zaključak vodećih laboratorija glasi: tvrtke koje rano prigrle interpretabilne modele mogle bi steći presudnu prednost – pouzdani, usklađeni i prilagodljivi sustavi lakše će proći regulatore i klijente.

Slično

Alexa+ najavljuje najveću preobrazbu Amazonova glasovnog asistenta
Amazon predstavio Alexa+, potpuno novu verziju glasovnog asistenta pokretanu velikim jezičnim modelima, koja korisnicima nudi prirodniji razgovor i obavljanje složenih online zadataka.

min čitanja

Više

Midjourney ulazi u AI video: jeftine animacije do 20 sekundi i tužba Disneya
Midjourney je predstavio prvi AI model za video, omogućivši korisnicima da statične slike pretvore u kratke animacije, no lansiranje prati tužba Disneya i Universala za navodno kršenje autorskih prava.

min čitanja

Više

OpenAI uklanja GPT-4.5 iz API-ja, programeri ogorčeni
OpenAI 14. srpnja ukida GPT-4.5 Preview iz API-ja, što je izazvalo lavinu negodovanja među programerima koji na modelu temelje svoje proizvode.

min čitanja

Više

Google predstavlja proizvodno spremne modele Gemini 2.5 i izravno izaziva OpenAI
Google je preveo modele Gemini 2.5 iz statusa pregleda u punu produkciju i uveo ultraštedljivu verziju Flash-Lite, ciljajući na širi spektar poslovnih korisnika i pojačavajući pritisak na OpenAI.

min čitanja

Više

DeepSeek izazvao potres u svijetu umjetne inteligencije
Kineski startup DeepSeek postigao je vrhunske AI rezultate uz djelić troškova konkurencije, natjeravši OpenAI, Microsoft i Metu na brze zaokrete i otvorivši novu raspravu o efikasnosti, sintetičkim podacima i rizicima autonomnog samokritičkog treniranja.

min čitanja

Više

Apple izazvao buru: jesu li LLM-ovi doista sposobni zaključivati?
Appleov istraživački rad o (ne)sposobnosti LLM-ova za zaključivanje izazvao je val kritika i suprotni studij koji tvrdi da su padovi performansi zapravo rezultat loše postavljenih testova, a ne manjka „inteligencije” modela.

min čitanja

Više

Google DeepMind predstavlja Gemini Diffusion i otvara utrku za munjevito brze jezične modele
Eksperimentalni Gemini Diffusion zamjenjuje autoregresijsko generiranje difuzijskim postupkom denoiziranja, postiže i do 2 000 tokena u sekundi te otvara nova pitanja o brzini, cijeni i točnosti budućih velikih jezičnih modela.

min čitanja

Više

Google Cloud zatajio: pad brojnih AI alata i popularnih servisa
Problemi u Google Cloud Platformi srušili su ChatGPT, Claude, Replit i druge AI alate te izazvali poteškoće na Discordu i Spotifyju.

min čitanja

Više

Silicijska dolina u potrazi za novim čudom: jesu li AI agenti doista „sljedeći veliki prodor”
Tehnološki divovi i start-upovi ulažu milijarde u AI agente koji bi samostalno obavljali zadatke umjesto ljudi. Donosimo pregled tko predvodi utrku, gdje su izazovi i što sve to znači za radna mjesta.

min čitanja

Više

Jeftini AI agenti podižu strah od nestanka početničkih poslova
Preniske cijene AI alata potiču tvrtke da mijenjaju juniore digitalnim agentima, upozorava industrija.

min čitanja

Više

Ostalo

Tadić: Ni Putin ne želi nuklearni Iran, izraelski napadi šalju opasnu poruku
Nuklearni stručnjak Tonči Tadić analizira napetosti oko iranskog nuklearnog programa, upozorava na regionalnu utrku u naoružanju i ističe da izraelski napadi nose i psihološku poruku.

min čitanja

Više

Vjerski radikal ubio zastupnicu Minnesote: tragovi karizmatskog nacionalizma
Kako je karizmatski propovjednik Vance Boelter povezao ekstremnu religijsku ideologiju s oružanim napadom na političare u Minnesoti.

min čitanja

Više

LED maske za lice osvajaju društvene mreže: što nude i koliko stoje
Popularnost LED maski za crvenu svjetlosnu terapiju raste, a dermatolozi pojašnjavaju na što paziti prilikom kupnje i izdvajaju šest najboljih uređaja.

min čitanja

Više

Nevladine udruge Europskoj komisiji: „Razbijte Googleov oglasni monopol”
Aktivisti s 116 000 potpisa traže od Bruxellesa da razdijeli Googleov oglasni biznis i okonča, kako tvrde, monopol koji šteti demokraciji i medijima.

min čitanja

Više

Treći put puca: PSL i Poland 2050 razdvajaju se pred izbore 2027.
Poljske stranke PSL i Poland 2050 napuštaju koaliciju Treći put i najavljuju samostalan izlazak na izbore 2027., ali ostaju u Tuskovoj vladi.

min čitanja

Više

Stručnjak upozorava: Dalmacija ide prema suptropskoj klimi, Slavoniji prijeti suša
Atmosferski fizičar Branko Grisogono prognozira suptropsku Dalmaciju, sušnu Slavoniju i sve češće superćelijske oluje, dok more već bilježi rekordne temperature.

min čitanja

Više

Revizor alarmira zbog zdravstva: rast duga, manjak revizora i potreba hitnih mjera
Državni revizor Ivan Klešić upozorava da rastuće obveze bolnica i manjak revizora prijete stabilnosti državnog proračuna.

min čitanja

Više

Ukrajinski zarobljenici vraćaju se iz ruskih logora s ožiljcima
Ukrajinski ratni zarobljenici izlaze iz ruskih logora s ožiljcima: vojnika Andrija ruski je kirurg pod anestezijom obilježio natpisom „Slava Rusiji”, a UN navodi da je više od 95 % puštenih zarobljenika bilo izloženo mučenju.

min čitanja

Više

Trumpov izaslanik za Ukrajinu najavljuje posjet Bjelorusiji i sastanak s Lukašenkom
Keith Kellogg nastoji posjetom Minsku osloboditi zatvorenike i otvoriti prostor za mirovne pregovore o Ukrajini.

min čitanja

Više