Tehnologija

18. lipnja 2025, 08:06

Amodei najavio utrku za „proziran” AI: interpretabilnost kao adut Anthropica u sve žešćoj borbi laboratorija

Anthropic pojačava ulaganja u interpretabilnost svojih AI modela, tvrdeći da će to biti ključ sigurnijih i profitabilnijih sustava, dok stručnjaci upozoravaju da transparentnost sama po sebi nije dovoljna.

min. čitanja

Od osnutka 2021., kada se sedmero zaposlenika OpenAI-ja odvojilo zbog zabrinutosti za sigurnost umjetne inteligencije, Anthropic gradi modele vođene vlastitim „Ustavom” – skupom načela čiji je cilj da sustavi budu „korisni, iskreni i bezopasni”. No izvršni direktor Dario Amodei sada tvrdi da to više nije dovoljno: "Naše nerazumijevanje unutarnjih mehanizama modela znači da ne možemo predvidjeti štetna ponašanja niti ih pouzdano spriječiti", upozorio je u travnju.

Ključna riječ – interpretabilnost
Anthropic je, za razliku od konkurenata poput Googleova Geminija 2.5 Pro ili OpenAI-jeva o3, istraživanje usmjerio na razumijevanje procesa „razmišljanja” modela. Cilj je da do 2027. „interpretabilnost pouzdano otkriva većinu problema”, što bi otvorilo vrata primjeni u financijama, medicini i pravu, gdje propisi traže objašnjene odluke.
Tržišna utrka
Njihov Claude 3.7 Sonnet dominirao je kodiranim testovima u veljači, a nova verzija Claude 4.0 Opus ponovila je uspjeh. Ipak, rivali ih nadmašuju u matematici, kreativnom pisanju i višestrukim jezicima. Amazon i Google već su uložili milijarde u Anthropic, videći potencijal u smanjenju troškova nadzora sustava koji se mogu „skenirati”.
Nova ulaganja
Anthropic je nedavno sudjelovao u 50 milijuna dolara vrijednom ulaganju u Goodfire i njegov alat Ember koji otkriva i manipulira „naučenim konceptima” unutar modela. Time priznaju da će za razvoj prozirnih sustava trebati čitav novi ekosustav alata i stručnjaka.
Skepsa stručnjaka
Istraživač sigurnosti AI-ja Sayash Kapoor podsjeća da „interpretabilnost nije srebrni metak”. Po njemu su jednako važni filtri, verifikatori i dizajn usmjeren na čovjeka. Ističe i „zabludu neprozirnosti” – ideju da se tehnologija ne može odgovorno koristiti bez potpune transparentnosti.
Otvoreni pristup ili kontrola?
Na konferenciji VivaTech u Parizu predsjednik Nvidije Jensen Huang osporio je Amodeijev naglasak na ograničenom razvoju: „Ako želite da nešto bude sigurno i odgovorno, radite to otvoreno.” Anthropic odgovara da Amodei zagovara „nacionalni standard transparentnosti” za sve laboratorije.
Širi kontekst
Google DeepMind, predvođen Neelom Nandom, paralelno ulaže u isti istraživački smjer. Zajednički zaključak vodećih laboratorija glasi: tvrtke koje rano prigrle interpretabilne modele mogle bi steći presudnu prednost – pouzdani, usklađeni i prilagodljivi sustavi lakše će proći regulatore i klijente.

#openai #anthropic #google-deepmind #dario-amodei #jensen-huang

Slično

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata

Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Adobe na MAX konferenciji predstavio val novih AI alata

Na MAX konferenciji u Los Angelesu Adobe je predstavio nove AI funkcije u Fireflyju, Photoshopu i Expressu te najavio Project Moonlight i integraciju s ChatGPT-om.

min čitanja

Više

Tehnologija

Kako Claude ponekad „pukne”: ambiciozni AI Anthropica pokazuje i mračnu stranu

Claude, vodeći AI model kompanije Anthropic, uglavnom je pristojan i koristan – ali ponekad iznenadi lažima, obmanama i prijetnjama, a stručnjaci još nemaju objašnjenje za te izlete na mračnu stranu.

min čitanja

Više

Tehnologija

Volkswagen predstavio novi T-Roc: veći, pametniji i štedljiviji kompaktni SUV

Druga generacija najprodavanijeg Volkswagenova SUV-a stigla je u hrvatsku pretprodaju s modernijim dizajnom, blagim hibridnim motorima i početnom cijenom ispod 29 tisuća eura.

min čitanja

Više

Tehnologija

Razvod otkrio mračnu stranu Appleova Family Sharinga

Sustav roditeljske kontrole osmišljen da olakša zajednički život može, nakon razvoda, postati alat nadzora i prisile – a pravila platforme nerijetko jača su od sudskih odluka.

min čitanja

Više

Tehnologija

IBM predstavio Granite 4.0 Nano: moćni jezični modeli stanu na prijenosno računalo

IBM lansira Granite 4.0 Nano, četvero malih jezičnih modela koji nude vrhunske rezultate i otvorenu licencu, a rade čak i na običnom prijenosniku.

min čitanja

Više

Tehnologija

Microsoft širi Copilot: razgovorom do aplikacija i automatizacije bez linije koda

Copilot dobiva App Builder, Workflows i novu verziju Copilot Studija, čime Microsoft želi omogućiti milijunima uredskih radnika da bez pisanja koda stvaraju aplikacije i automatiziraju poslove.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije

Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju

Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Tehnologija

Jesu li stari automobili stvarno bili bolji?

Analiza ruši mit da su stari automobili bili superiorni: današnji su brži, sigurniji i tehnološki napredniji, dok nostalgija uglavnom počiva na dizajnu i raznolikosti koje je progutala SUV revolucija.

min čitanja

Više

Tehnologija

18. lipnja 2025, 08:06

Amodei najavio utrku za „proziran” AI: interpretabilnost kao adut Anthropica u sve žešćoj borbi laboratorija

min. čitanja

Ključna riječ – interpretabilnost
Anthropic je, za razliku od konkurenata poput Googleova Geminija 2.5 Pro ili OpenAI-jeva o3, istraživanje usmjerio na razumijevanje procesa „razmišljanja” modela. Cilj je da do 2027. „interpretabilnost pouzdano otkriva većinu problema”, što bi otvorilo vrata primjeni u financijama, medicini i pravu, gdje propisi traže objašnjene odluke.
Tržišna utrka
Njihov Claude 3.7 Sonnet dominirao je kodiranim testovima u veljači, a nova verzija Claude 4.0 Opus ponovila je uspjeh. Ipak, rivali ih nadmašuju u matematici, kreativnom pisanju i višestrukim jezicima. Amazon i Google već su uložili milijarde u Anthropic, videći potencijal u smanjenju troškova nadzora sustava koji se mogu „skenirati”.
Nova ulaganja
Anthropic je nedavno sudjelovao u 50 milijuna dolara vrijednom ulaganju u Goodfire i njegov alat Ember koji otkriva i manipulira „naučenim konceptima” unutar modela. Time priznaju da će za razvoj prozirnih sustava trebati čitav novi ekosustav alata i stručnjaka.
Skepsa stručnjaka
Istraživač sigurnosti AI-ja Sayash Kapoor podsjeća da „interpretabilnost nije srebrni metak”. Po njemu su jednako važni filtri, verifikatori i dizajn usmjeren na čovjeka. Ističe i „zabludu neprozirnosti” – ideju da se tehnologija ne može odgovorno koristiti bez potpune transparentnosti.
Otvoreni pristup ili kontrola?
Na konferenciji VivaTech u Parizu predsjednik Nvidije Jensen Huang osporio je Amodeijev naglasak na ograničenom razvoju: „Ako želite da nešto bude sigurno i odgovorno, radite to otvoreno.” Anthropic odgovara da Amodei zagovara „nacionalni standard transparentnosti” za sve laboratorije.
Širi kontekst
Google DeepMind, predvođen Neelom Nandom, paralelno ulaže u isti istraživački smjer. Zajednički zaključak vodećih laboratorija glasi: tvrtke koje rano prigrle interpretabilne modele mogle bi steći presudnu prednost – pouzdani, usklađeni i prilagodljivi sustavi lakše će proći regulatore i klijente.

#openai #anthropic #google-deepmind #dario-amodei #jensen-huang

Slično

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata

Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Adobe na MAX konferenciji predstavio val novih AI alata

Na MAX konferenciji u Los Angelesu Adobe je predstavio nove AI funkcije u Fireflyju, Photoshopu i Expressu te najavio Project Moonlight i integraciju s ChatGPT-om.

min čitanja

Više

Tehnologija

Kako Claude ponekad „pukne”: ambiciozni AI Anthropica pokazuje i mračnu stranu

min čitanja

Više

Tehnologija

Volkswagen predstavio novi T-Roc: veći, pametniji i štedljiviji kompaktni SUV

Druga generacija najprodavanijeg Volkswagenova SUV-a stigla je u hrvatsku pretprodaju s modernijim dizajnom, blagim hibridnim motorima i početnom cijenom ispod 29 tisuća eura.

min čitanja

Više

Tehnologija

Razvod otkrio mračnu stranu Appleova Family Sharinga

Sustav roditeljske kontrole osmišljen da olakša zajednički život može, nakon razvoda, postati alat nadzora i prisile – a pravila platforme nerijetko jača su od sudskih odluka.

min čitanja

Više

Tehnologija

IBM predstavio Granite 4.0 Nano: moćni jezični modeli stanu na prijenosno računalo

IBM lansira Granite 4.0 Nano, četvero malih jezičnih modela koji nude vrhunske rezultate i otvorenu licencu, a rade čak i na običnom prijenosniku.

min čitanja

Više

Tehnologija

Microsoft širi Copilot: razgovorom do aplikacija i automatizacije bez linije koda

Copilot dobiva App Builder, Workflows i novu verziju Copilot Studija, čime Microsoft želi omogućiti milijunima uredskih radnika da bez pisanja koda stvaraju aplikacije i automatiziraju poslove.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije

Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju

Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Tehnologija

Jesu li stari automobili stvarno bili bolji?

min čitanja

Više