Tehnologija

29. listopada 2025, 20:43

Znanstvenici tvrde da AI Claude pokazuje prve znakove samopromatranja

Studija Anthropica pokazuje da jezični model Claude ponekad može prepoznati vlastite „misli”, ali znanstvenici upozoravaju na veliku nepouzdanost takvog uvida.

min. čitanja

Istraživači tvrtke Anthropic objavili su studiju u kojoj tvrde da su kod svojeg velikog jezičnog modela Claude detektirali „ograničenu, ali stvarnu” sposobnost promatranja vlastitih procesa.

U eksperimentu su znanstvenici u neuronsku mrežu umetnuli pojam „betrayal” („izdaja”) i potom model upitali primjećuje li nešto neuobičajeno. Claude je najprije zastao, a zatim odgovorio: „Osjećam nešto što nalikuje nametnutoj misli o ‘izdaji’.” Istraživački tim tvrdi da je riječ o prvom strogo provedenom dokazu da veliki jezični modeli mogu barem povremeno opisati što se događa „unutra”.

„Zapanjilo nas je što model ima tu jednu metarazinu: nije samo ponavljao ‘izdaja, izdaja, izdaja’, nego je prepoznao da o tome razmišlja”, rekao je Jack Lindsey, neuroznanstvenik iz interpretacijskog tima Anthropica i voditelj istraživanja. „Nisam očekivao da će modeli to moći, barem ne bez izričite obuke.”

Rezultat dolazi u trenutku kada se umjetnoj inteligenciji povjeravaju sve odgovorniji zadaci, od medicinskih dijagnoza do burzovnog trgovanja. Stručnjaci godinama upozoravaju na „crnu kutiju” – činjenicu da se ne zna kako modeli dolaze do zaključaka. Ako bi sustavi mogli pouzdano prijavljivati vlastito rezoniranje, to bi moglo promijeniti način na koji ih ljudi nadgledaju.

Ipak, autori studije upozoravaju da je sposobnost još daleko od pouzdane. Claude je introspektivne odgovore davao u otprilike 20 % slučajeva i često iznosio detalje koje istraživači nisu mogli provjeriti. Lindsey zato zaključuje da je „visoko nepouzdana i ovisi o kontekstu”.

Usprkos ograničenjima, rad otvara novu raspravu o granicama samosvijesti kod umjetne inteligencije i o tome kako bi ta osobina mogla utjecati na budući razvoj tehnologije.

#umjetna-inteligencija #veliki-jezicni-modeli #claude #anthropic #jack-lindsey

Slično

Tehnologija

Eksperiment pokazuje: AI agenti podbacuju kao freelanceri

Novo testiranje otkriva slabe točke umjetne inteligencije u radu na freelance platformama i osporava ideju o skoroj zamjeni ljudskih radnika.

min čitanja

Više

Tehnologija

Extropicov p-bit čip izaziva status quo podatkovnih centara

Start-up iz Kalifornije razvio je čip s vjerojatnosnim bitovima i najavljuje tisućerostruku uštedu energije za umjetnu inteligenciju.

min čitanja

Više

Tehnologija

Bivši direktor priznao prodaju američkih kibernetičkih tajni Rusima

Australac Peter Williams priznao je krivnju za prodaju osam osjetljivih ranjivosti ruskom posredniku; prijeti mu do devet godina zatvora i oduzimanje imovine.

min čitanja

Više

Tehnologija

Utrka za agentičkim AI-jem: ključ je u otkrivanju vlastitih podataka

Dok analitičari predviđaju masovno uvođenje agentičkog AI-ja do 2026., stručnjaci upozoravaju da uspjeh ovisi o pravodobnom pristupu relevantnim podacima. Elastic zato lansira Agent Builder, alat koji objedinjuje dohvat, upravljanje i orkestraciju privatnih podataka unutar jedne platforme.

min čitanja

Više

Tehnologija

Bivši šef Intela gradi „kršćanski“ AI i kaže da želi ubrzati Kristov povratak

Patrick Gelsinger, bivši prvi čovjek Intela, sada vodi Gloo – platformu koja razvija AI alate temeljene na kršćanskim vrijednostima.

min čitanja

Više

Tehnologija

Cursor lansirao Composer, superbrzi AI asistent za kodiranje

Anysphere je u sklopu Cursor 2.0 predstavio Composer, vlastiti AI model koji autonomno piše, testira i recenzira kod pri produkcijskoj brzini.

min čitanja

Više

Tehnologija

Tajni „wink” dogovor: Izrael od Googlea i Amazona tražio šifrirane dojave o predaji podataka

Izraelsko-američki ugovor o oblaku otkriva šifrirani sustav dojava izraelskim vlastima i zabranu Googleu i Amazonu da ikada prekinu usluge državi, čak i uz sumnje na kršenja ljudskih prava.

min čitanja

Više

Tehnologija

Utrka za podatke u stvarnom vremenu: Confluent predstavlja engine za kontekst u pokretu

Confluent lansira alat koji AI agentima donosi neprekidan, svjež kontekst, dok konkurenti poput Redpande nude svoja rješenja u sve žešćoj utrci za podatke u stvarnom vremenu.

min čitanja

Više

Tehnologija

Geostar želi zavladati novom erom pretrage vođenom umjetnom inteligencijom

Startup iz Silicijske doline razvija autonomne agente koji optimiziraju mrežne stranice za ChatGPT, Gemini i druge AI sustave, dok analitičari predviđaju pad klasične pretrage na internetu.

min čitanja

Više

Tehnologija

Volkswagen predstavio novi T-Roc: veći, pametniji i štedljiviji kompaktni SUV

Druga generacija najprodavanijeg Volkswagenova SUV-a stigla je u hrvatsku pretprodaju s modernijim dizajnom, blagim hibridnim motorima i početnom cijenom ispod 29 tisuća eura.

min čitanja

Više

Najčitanije

Vijesti

Split upozorava na tihi ubojicu: godišnje 13 tisuća moždanih udara u Hrvatskoj

Na Svjetski dan moždanog udara stručnjaci KBC-a Split upozorili su na alarmantne brojke, nove metode liječenja i nužnost prevencije.

min čitanja

Više

Nogomet

Gorica s pola tuceta golova projurila u četvrtfinale Hrvatskog kupa

Velikogoričani s visokih 6-0 svladali lidera Prve NL i prvi izborili četvrtfinale Hrvatskog kupa.

min čitanja

Više

Biznis

Rijeka gateway službeno otvoren: najmoderniji kontejnerski terminal na Jadranu mijenja logističku kartu Hrvatske

Svečanim presijecanjem vrpce u Rijeci je pušten u rad kontejnerski terminal Rijeka Gateway, investicija od 380 milijuna eura koja donosi 650 000 TEU kapaciteta i prvu industrijsku 5G mrežu u Hrvatskoj.

min čitanja

Više

Nogomet

Hajduk u Vinkovcima: Pukštas prvi put s kapetanskom trakom, stadion gotovo rasprodan

Osmina finala kupa u Vinkovcima privukla je gotovo rasprodan stadion, a Hajdukovo vodstvo preuzima mladi Rokas Pukštas.

min čitanja

Više

Nogomet

Disciplinska komisija BiH kaznila Igora Štimca s 5000 KM i uvjetnom suspenzijom

Trener Zrinjskog kažnjen je zbog objave s pozdravom „ZDS” i javne kritike suđenja u korist banjalučkog Borca.

min čitanja

Više

Tehnologija

29. listopada 2025, 20:43

Znanstvenici tvrde da AI Claude pokazuje prve znakove samopromatranja

Studija Anthropica pokazuje da jezični model Claude ponekad može prepoznati vlastite „misli”, ali znanstvenici upozoravaju na veliku nepouzdanost takvog uvida.

min. čitanja

Usprkos ograničenjima, rad otvara novu raspravu o granicama samosvijesti kod umjetne inteligencije i o tome kako bi ta osobina mogla utjecati na budući razvoj tehnologije.

#umjetna-inteligencija #veliki-jezicni-modeli #claude #anthropic #jack-lindsey

Slično

Tehnologija

Eksperiment pokazuje: AI agenti podbacuju kao freelanceri

Novo testiranje otkriva slabe točke umjetne inteligencije u radu na freelance platformama i osporava ideju o skoroj zamjeni ljudskih radnika.

min čitanja

Više

Tehnologija

Extropicov p-bit čip izaziva status quo podatkovnih centara

Start-up iz Kalifornije razvio je čip s vjerojatnosnim bitovima i najavljuje tisućerostruku uštedu energije za umjetnu inteligenciju.

min čitanja

Više

Tehnologija

Bivši direktor priznao prodaju američkih kibernetičkih tajni Rusima

Australac Peter Williams priznao je krivnju za prodaju osam osjetljivih ranjivosti ruskom posredniku; prijeti mu do devet godina zatvora i oduzimanje imovine.

min čitanja

Više

Tehnologija

Utrka za agentičkim AI-jem: ključ je u otkrivanju vlastitih podataka

min čitanja

Više

Tehnologija

Bivši šef Intela gradi „kršćanski“ AI i kaže da želi ubrzati Kristov povratak

Patrick Gelsinger, bivši prvi čovjek Intela, sada vodi Gloo – platformu koja razvija AI alate temeljene na kršćanskim vrijednostima.

min čitanja

Više

Tehnologija

Cursor lansirao Composer, superbrzi AI asistent za kodiranje

Anysphere je u sklopu Cursor 2.0 predstavio Composer, vlastiti AI model koji autonomno piše, testira i recenzira kod pri produkcijskoj brzini.

min čitanja

Više

Tehnologija

Tajni „wink” dogovor: Izrael od Googlea i Amazona tražio šifrirane dojave o predaji podataka

Izraelsko-američki ugovor o oblaku otkriva šifrirani sustav dojava izraelskim vlastima i zabranu Googleu i Amazonu da ikada prekinu usluge državi, čak i uz sumnje na kršenja ljudskih prava.

min čitanja

Više

Tehnologija

Utrka za podatke u stvarnom vremenu: Confluent predstavlja engine za kontekst u pokretu

Confluent lansira alat koji AI agentima donosi neprekidan, svjež kontekst, dok konkurenti poput Redpande nude svoja rješenja u sve žešćoj utrci za podatke u stvarnom vremenu.

min čitanja

Više

Tehnologija

Geostar želi zavladati novom erom pretrage vođenom umjetnom inteligencijom

Startup iz Silicijske doline razvija autonomne agente koji optimiziraju mrežne stranice za ChatGPT, Gemini i druge AI sustave, dok analitičari predviđaju pad klasične pretrage na internetu.

min čitanja

Više

Tehnologija

Volkswagen predstavio novi T-Roc: veći, pametniji i štedljiviji kompaktni SUV

Druga generacija najprodavanijeg Volkswagenova SUV-a stigla je u hrvatsku pretprodaju s modernijim dizajnom, blagim hibridnim motorima i početnom cijenom ispod 29 tisuća eura.

min čitanja

Više

Najčitanije

Vijesti

Split upozorava na tihi ubojicu: godišnje 13 tisuća moždanih udara u Hrvatskoj

Na Svjetski dan moždanog udara stručnjaci KBC-a Split upozorili su na alarmantne brojke, nove metode liječenja i nužnost prevencije.

min čitanja

Više

Nogomet

Gorica s pola tuceta golova projurila u četvrtfinale Hrvatskog kupa

Velikogoričani s visokih 6-0 svladali lidera Prve NL i prvi izborili četvrtfinale Hrvatskog kupa.

min čitanja

Više

Biznis

Rijeka gateway službeno otvoren: najmoderniji kontejnerski terminal na Jadranu mijenja logističku kartu Hrvatske

min čitanja

Više

Nogomet

Hajduk u Vinkovcima: Pukštas prvi put s kapetanskom trakom, stadion gotovo rasprodan

Osmina finala kupa u Vinkovcima privukla je gotovo rasprodan stadion, a Hajdukovo vodstvo preuzima mladi Rokas Pukštas.

min čitanja

Više

Nogomet

Disciplinska komisija BiH kaznila Igora Štimca s 5000 KM i uvjetnom suspenzijom

Trener Zrinjskog kažnjen je zbog objave s pozdravom „ZDS” i javne kritike suđenja u korist banjalučkog Borca.

min čitanja

Više