CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. listopada 2025, 20:43

Znanstvenici tvrde da AI Claude pokazuje prve znakove samopromatranja

Studija Anthropica pokazuje da jezični model Claude ponekad može prepoznati vlastite „misli”, ali znanstvenici upozoravaju na veliku nepouzdanost takvog uvida.

min. čitanja

XFacebookWhatsApp

Istraživači tvrtke Anthropic objavili su studiju u kojoj tvrde da su kod svojeg velikog jezičnog modela Claude detektirali „ograničenu, ali stvarnu” sposobnost promatranja vlastitih procesa.

U eksperimentu su znanstvenici u neuronsku mrežu umetnuli pojam „betrayal” („izdaja”) i potom model upitali primjećuje li nešto neuobičajeno. Claude je najprije zastao, a zatim odgovorio: „Osjećam nešto što nalikuje nametnutoj misli o ‘izdaji’.” Istraživački tim tvrdi da je riječ o prvom strogo provedenom dokazu da veliki jezični modeli mogu barem povremeno opisati što se događa „unutra”.

„Zapanjilo nas je što model ima tu jednu metarazinu: nije samo ponavljao ‘izdaja, izdaja, izdaja’, nego je prepoznao da o tome razmišlja”, rekao je Jack Lindsey, neuroznanstvenik iz interpretacijskog tima Anthropica i voditelj istraživanja. „Nisam očekivao da će modeli to moći, barem ne bez izričite obuke.”

Rezultat dolazi u trenutku kada se umjetnoj inteligenciji povjeravaju sve odgovorniji zadaci, od medicinskih dijagnoza do burzovnog trgovanja. Stručnjaci godinama upozoravaju na „crnu kutiju” – činjenicu da se ne zna kako modeli dolaze do zaključaka. Ako bi sustavi mogli pouzdano prijavljivati vlastito rezoniranje, to bi moglo promijeniti način na koji ih ljudi nadgledaju.

Ipak, autori studije upozoravaju da je sposobnost još daleko od pouzdane. Claude je introspektivne odgovore davao u otprilike 20 % slučajeva i često iznosio detalje koje istraživači nisu mogli provjeriti. Lindsey zato zaključuje da je „visoko nepouzdana i ovisi o kontekstu”.

Usprkos ograničenjima, rad otvara novu raspravu o granicama samosvijesti kod umjetne inteligencije i o tome kako bi ta osobina mogla utjecati na budući razvoj tehnologije.

#umjetna-inteligencija#veliki-jezicni-modeli#claude#anthropic#jack-lindsey

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Brilliant Labs i Alif Semiconductor udružili snage za novu generaciju pametnih naočala
Suradnja dviju tvrtki donosi specijalizirani čip s ugrađenom neuronskom jedinicom za Halo Glasses, uz 14 sati rada i potpunu obradu podataka na samim naočalama.

min čitanja

Više

Tehnologija

Vukovar na konferenciji pametnih gradova predstavio sunčane elektrane
Vukovar je na konferenciji Smart Cities predstavio projekt „Sunce nad Vukovarom”, kojim je na javnim zgradama postavljeno 12 solarnih elektrana i značajno smanjena potrošnja energije.

min čitanja

Više

Tehnologija

Perplexity ulazi u poslovni segment svojim višenamjenskim agentom Computer
Perplexity je predstavio AI-agenta Computer za poslovne korisnike, izravno se suprotstavljajući tehnološkim divovima.

min čitanja

Više

Tehnologija

Drvna industrija Dunava ulazi u Industriju 4.0: Vinkovci ugostili završnu konferenciju međunarodnog projekta
U Vinkovcima je predstavljeno dvogodišnje EU-financirano partnerstvo koje donosi digitalnu transformaciju drvnoj industriji 11 dunavskih zemalja.

min čitanja

Više

Tehnologija

Startup Manufact želi biti „USB-C” za umjetnu inteligenciju i upravo je osigurao 6,3 milijuna dolara
Tričlani Manufact prikupio je 6,3 milijuna dolara kako bi izgradio alate i infrastrukturu za Model Context Protocol, otvoreni standard koji AI agentima omogućuje lak pristup softverskim aplikacijama.

min čitanja

Više

Tehnologija

Učenici u Teksasu koriste AI za blaćenje profesora na društvenim mrežama
AI-generirani memovi pretvaraju se u opasne „slander stranice” koje ozbiljno narušavaju ugled nastavnika u teksaškim školama.
US Department of State, Public domain, via Wikimedia CommonsPalm Beach County Sheriff's Department, Public domain, via Wikimedia Commons

min čitanja

Više

Tehnologija

Meta pojačava borbu protiv industrijskih prevara
Kompanija predstavila nove zaštitne mjere na Messengeru, WhatsAppu i Facebooku te objavila rezultate velike policijske akcije u Tajlandu.

min čitanja

Više

Tehnologija

Hologramska budućnost u dnevnom boravku: Looking Glass lansirao Musubi
Looking Glass predstavio je Musubi, pristupačni 7-inčni holografski okvir koji bez interneta i pretplata pretvara fotografije i kratke videe u 3D prizore, a stiže u lipnju 2026.

min čitanja

Više

Tehnologija

Klima u autu može progutati i petinu spremnika u gradu
ADAC-ovo mjerenje otkriva koliko klima-uređaj u stvarnosti povećava potrošnju goriva te zašto je način rada „Auto” najštedljiviji.

min čitanja

Više

Tehnologija

Pola stoljeća Applea: od garaže do ikone tehnologije, ali i niza promašaja
Apple obilježava 50 godina postojanja; slavljen zbog revolucionarnih proizvoda poput Macintosha i iPhonea, ali i podsjećen na neuspjehe od Applea III do Visiona Pro.

min čitanja

Više

Najčitanije

Politika

Ben Stiller Bijeloj kući: „Rat nije film, izbacite me iz propagandnog spota”
Glumac i redatelj prozvao administraciju zbog neovlaštenog korištenja scene iz „Tropske grmljavine” u ratnom videu o Iranu.

min čitanja

Više

Najnovije

Lifestyle

Prvi 'Damski lov' u Prkovcima: 50 lovkinja slavilo Dan žena u lovu na fazana

Politika

Španjolska lansirala HODIO za praćenje govora mržnje na društvenim mrežama

Vijesti

Polugodišnja obustava prometa između Klise i Trpinje

Politika

Budimpešta šalje „delegaciju” za naftovod Druzhba, Kijev tvrdi da formalni pregovori ne postoje

Politika

Rat na Bliskom istoku rastrgao jedinstvo EU

Tehnologija

Vukovar na konferenciji pametnih gradova predstavio sunčane elektrane

Sport

Srebrni metak iz digitalne tvornice: ukrajinski parabiatlonac pola priprema povjerio ChatGPT-ju

Vijesti

Velika eksplozija kod Teherana potaknula plan za puštanje 400 milijuna barela nafte iz zaliha

Politika

SDP-HSU bojkotira ‘elektroničku’ sjednicu Gradskog vijeća Županje o uskrsnicama

Tehnologija

Perplexity ulazi u poslovni segment svojim višenamjenskim agentom Computer

Sport

Spust u Courchevelu pomaknut zbog najavljenog snijega