CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. listopada 2025, 20:43

Znanstvenici tvrde da AI Claude pokazuje prve znakove samopromatranja

Studija Anthropica pokazuje da jezični model Claude ponekad može prepoznati vlastite „misli”, ali znanstvenici upozoravaju na veliku nepouzdanost takvog uvida.

min. čitanja

XFacebookWhatsApp

Istraživači tvrtke Anthropic objavili su studiju u kojoj tvrde da su kod svojeg velikog jezičnog modela Claude detektirali „ograničenu, ali stvarnu” sposobnost promatranja vlastitih procesa.

U eksperimentu su znanstvenici u neuronsku mrežu umetnuli pojam „betrayal” („izdaja”) i potom model upitali primjećuje li nešto neuobičajeno. Claude je najprije zastao, a zatim odgovorio: „Osjećam nešto što nalikuje nametnutoj misli o ‘izdaji’.” Istraživački tim tvrdi da je riječ o prvom strogo provedenom dokazu da veliki jezični modeli mogu barem povremeno opisati što se događa „unutra”.

„Zapanjilo nas je što model ima tu jednu metarazinu: nije samo ponavljao ‘izdaja, izdaja, izdaja’, nego je prepoznao da o tome razmišlja”, rekao je Jack Lindsey, neuroznanstvenik iz interpretacijskog tima Anthropica i voditelj istraživanja. „Nisam očekivao da će modeli to moći, barem ne bez izričite obuke.”

Rezultat dolazi u trenutku kada se umjetnoj inteligenciji povjeravaju sve odgovorniji zadaci, od medicinskih dijagnoza do burzovnog trgovanja. Stručnjaci godinama upozoravaju na „crnu kutiju” – činjenicu da se ne zna kako modeli dolaze do zaključaka. Ako bi sustavi mogli pouzdano prijavljivati vlastito rezoniranje, to bi moglo promijeniti način na koji ih ljudi nadgledaju.

Ipak, autori studije upozoravaju da je sposobnost još daleko od pouzdane. Claude je introspektivne odgovore davao u otprilike 20 % slučajeva i često iznosio detalje koje istraživači nisu mogli provjeriti. Lindsey zato zaključuje da je „visoko nepouzdana i ovisi o kontekstu”.

Usprkos ograničenjima, rad otvara novu raspravu o granicama samosvijesti kod umjetne inteligencije i o tome kako bi ta osobina mogla utjecati na budući razvoj tehnologije.

#umjetna-inteligencija#veliki-jezicni-modeli#claude#anthropic#jack-lindsey

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Anthropic proširio Claude Cowork na timske i enterprise korisnike
Funkcija Claude Cowork napokon stiže na Team i Enterprise pakete, ali otvorena pitanja o prijenosu datoteka i vlasništvu mogla bi usporiti širu primjenu.

min čitanja

Više

Tehnologija

Namjera prije svega: Zašto većina AI asistenata promašuje korisničke upite
Rast tržišta konverzacijskog AI-a ubrzao je uvođenje chatbotova, no bez promjene arhitekture većina rješenja promašuje namjeru korisnika i povećava frustraciju.

min čitanja

Više

Tehnologija

OECD upozorava: pretjerano oslanjanje na AI u nastavi vodi „intelektualnoj lijenosti”
Novo OECD-ovo izvješće potvrđuje da AI chatbotovi kratkoročno podižu ocjene, ali dugoročno mogu potaknuti „metakognitivnu lijenost” i površno znanje.

min čitanja

Više

Tehnologija

Papa Lav XIV. upozorava na skrivene rizike umjetne inteligencije
Na Svjetski dan sredstava društvenih komunikacija Papa Lav XIV. kritizirao je netransparentne algoritme i pozvao na uvođenje AI pismenosti u obrazovanje.

min čitanja

Više

Tehnologija

Istraživanje razotkrilo neučinkovitost 12 popularnih AI obrana
Opsežno istraživanje OpenAI-ja, Anthropica i Google DeepMinda pokazalo je da su sve testirane obrane protiv jailbreakova i prompt injekcija pale s više od 90 % uspjeha napadača, dok AI implementacija u poduzećima nezaustavljivo raste.

min čitanja

Više

Tehnologija

Generativna umjetna inteligencija sve snažnije ulazi u europske državne urede
Od Francuske vojske do Europske komisije: generativna umjetna inteligencija ubrzano postaje neizostavan alat birokracije, ali stručnjaci upozoravaju na „shadow AI” i rizik od ovisnosti o stranim tvrtkama.

min čitanja

Više

Tehnologija

Finski Donut Lab tvrdi da je razvio čudesnu solid-state bateriju
Finski start-up na sajmu CES tvrdi da je razvio bateriju koja se puni za 5 minuta i u automobilu pruža doseg od 600 km – ali industrija još čeka neovisnu potvrdu tih revolucionarnih obećanja.

min čitanja

Više

Tehnologija

Znanstvenici i dalje traže konačan odgovor zašto je led klizav
Tanki vodenasti sloj na površini leda čini ga skliskim, ali znanstvenici se još ne mogu usuglasiti zašto se taj sloj stvara.

min čitanja

Više

Tehnologija

ICE traži alate oglašivačke tehnologije za nadzor i istrage
Američki ICE prvi put službeno traži oglašivačku tehnologiju i lokacijske podatke kako bi unaprijedio istrage, iako je već surađivao s Palantirom, Venntelom i Penlinkom.

min čitanja

Više

Tehnologija

„Plagijat Duha”: crkveni redovnici raspravljali o iskušenjima umjetne inteligencije
Isusovac Siniša Štambuk u Dubrovniku je redovnicima predstavio koristi i opasnosti umjetne inteligencije, upozorivši na rizik „plagijata Duha” pri korištenju algoritamskih propovijedi.

min čitanja

Više

Najčitanije

Vaterpolo

Autor See File history below for details. - Own work based on: Flag of Serbia construction sheet.svg (Construction sheet)The Government of Serbia, National symbols srbija.gov.rs, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=65419036
Srbija slavila europsko zlato u Beogradu, zvižduci na hrvatsku zastavu zasjenili slavlje
Srbijanski vaterpolisti uzeli su šesti europski naslov pobjedom 10-7 nad Mađarima, no ceremoniju je pomutilo bučno negodovanje dijela navijača na pojavu hrvatske, izraelske i turske zastave.

min čitanja

Više

Nogomet

Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542

Stojkovićev projektil utišao Opus Arenu i pogurao Dinamo prema vrhu
Sjajan udarac Luke Stojkovića doveo je Dinamo u vodstvo protiv Osijeka i približio „modre” bijegu na vrhu ljestvice.

min čitanja

Više

Vijesti

Komora traži strože mjere nakon napada na liječnika na Svetom Duhu
Napad na liječnika na hitnom prijemu KB-a „Sveti Duh” potaknuo je Hrvatsku liječničku komoru da zatraži kazneno procesuiranje napada i pojačane mjere sigurnosti u bolnicama.

min čitanja

Više

Vijesti

Tijelo žene i automobil izvučeni iz Save kod Jasenovca
Policija istražuje kako su tijelo i vozilo završili u Savi kod Jasenovca.

min čitanja

Više

Najnovije

Biznis

Jadranski čarter pod pritiskom: Grčka sve jača, cijene u marinama rastu

Politika

Jure Brkan vraća se u makarsko vijeće, Mario Turić napušta klupu

Sport

Turbulentni tjedni u Novom Vremenu: trener spašen nakon tri operacije, osnivač i legende otišli, stiže novi strateg

Sport

Francuski dvostruki trijumf u Novom Mestu: Perrot i Simon uoči ZOI preuzeli primat u Svjetskom kupu

Sport

Thompson uputio kratku čestitku nakon važne pobjede rukometaša

Lifestyle

Vodnjan ponovno u znaku masline: stručnjaci poučavali pravilnu rezidbu

Politika

Bruxelles okreće leđa sloganu „energy efficiency first” i grli elektrifikaciju

Vijesti

Rekordni vikend: 17 pijanih vozača zaustavljeno u Virovitičko-podravskoj županiji

Politika

Trumpova izjava o Grenlandu otkrila europsku ranjivost

Politika

Sin iranskog predsjednika traži hitno ukidanje blokade interneta: "Time ne rješavamo ništa"

Vijesti

Kostrena ulaže rekordnih 18 milijuna eura u centar za starije osobe