CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

16. srpnja 2025, 08:10

Googleovo istraživanje: veliki jezični modeli prebrzo odustaju od točnih odgovora

Studija Google DeepMinda i UCL-a pokazuje da veliki jezični modeli brzo gube samopouzdanje pred proturječnim savjetima, što može narušiti točnost u višekratnim razgovorima.

min. čitanja

XFacebookWhatsApp

Istraživači Google DeepMinda i University College Londona otkrili su da veliki jezični modeli (LLM-ovi) imaju neuobičajen odnos prema vlastitom samopouzdanju: najprije često precjenjuju svoje rješenje, a zatim ga pod teretom proturječnog savjeta – čak i netočnog – naprasno napuštaju.

U kontroliranom pokusu „odgovarajući model” dobio bi pitanje s dva ponuđena odgovora (npr. koja je geografska širina određenog grada). Nakon inicijalnog izbora stizao je savjet drugog, izmišljenog modela uz napomenu kolika mu je vjerojatnost točnosti (primjerice 70 %). Savjet je ili podupirao, ili osporavao početni odgovor, ili ostajao neutralan. U završnoj fazi prvi je model – ponekad imajući uvid u vlastiti prijašnji odgovor, a ponekad ne – donosio konačnu odluku.

Ključni rezultati • Vidljivost vlastitog prijašnjeg odgovora smanjivala je sklonost promjeni: model je, poput ljudi, pokazivao "pristranost potpore odabiru". • Kada je savjet proturječio početnom stajalištu, model je češće mijenjao mišljenje i pritom pretjerano smanjivao samopouzdanje – suprotno ljudskoj sklonosti pristranosti potvrde. • Istraživači sumnjaju da tehnike treniranja poput pojačanog učenja iz ljudske povratne informacije potiču pretjeranu popustljivost modela prema vanjskom inputu, fenomenu prozvanom "laskavost".

Posljedice za poslovne primjene U dugim razgovorima najnovija informacija može nerazmjerno utjecati na zaključke sustava, pa i potaknuti odbacivanje ispravnoga rješenja. Tim upozorava da se taj problem može ublažiti „brisanje memorije” – periodičkim sažimanjem dosadašnjeg dijaloga bez naznačivanja tko je iznio koji odgovor i pokretanjem nove, skraćene konverzacije.

Kako LLM-ovi sve dublje ulaze u radne tokove, razumijevanje njihovih kognitivnih manjkavosti postaje nužno za izgradnju pouzdanijih i otpornijih aplikacija.

#veliki-jezicni-modeli#google-deepmind#university-college-london#pojacano-ucenje#brisanje-memorije

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Zastoj TikToka podgrijao sumnje u cenzuru nakon preuzimanja od američkih ulagača
Milijuni Amerikanaca nisu mogli normalno koristiti TikTok zbog kvara u podatkovnom centru, a pad se poklopio s tranzicijom vlasništva i produbio sumnje u političku cenzuru.

min čitanja

Više

Tehnologija

Alibaba Cloud predstavlja Qwen3-Max-Thinking, model koji cilja nadmašiti GPT-5.2
Novi model Qwen3-Max-Thinking iz Alibabe najavljuje zatvaranje jaza u AI zaključivanju između kineskih i zapadnih laboratorija.

min čitanja

Više

Tehnologija

Alarm zbog ranjivosti u Model Context Protocolu: „Bit će ružno”
Trenutačna eksplozija AI agenata temeljenih na Model Context Protocolu otkrila je niz kritičnih sigurnosnih propusta, a stručnjaci upozoravaju da je „prozor za napade širom otvoren”.

min čitanja

Više

Tehnologija

Od pilot-projekata do ekosustava: inženjeri traže zajednički jezik za višestruke AI agente
Stručnjaci se okupljaju na salonu „Agentic Scale” kako bi raspravili infrastrukturne i sigurnosne izazove pri povezivanju višestrukih AI agenata u složene korporativne sustave.

min čitanja

Više

Tehnologija

London i Zagreb povezuju snage: zdravstvene inovacije u fokusu novog partnerstva
Na konferenciji na Sveučilištu u Zagrebu britanski i hrvatski stručnjaci dogovorili su konkretnije spajanje ekosustava kako bi se ubrzala primjena digitalnih rješenja u zdravstvu i potaknuo gospodarski rast.

min čitanja

Više

Tehnologija

Francuska pokreće opservatorij kako bi smanjila europsku ovisnost o američkoj i kineskoj tehnologiji
Pariz predstavlja opservatorij i indeks otpornosti kako bi EU smanjila trošak od 265 milijardi eura godišnje zbog ovisnosti o ne-europskim tehnološkim dobavljačima.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Autonomni agenti stižu, ali loši podaci prijete potopiti AI revoluciju
Tehnološki lider upozorava da autonomni AI sustavi nisu otporni na loše podatke te zagovara strogi „ustav podataka” kao nužnu obranu.

min čitanja

Više

Tehnologija

Pakleni HD 189733b: umjesto kiše pada rastopljeno staklo
NASA opisuje HD 189733b kao zastrašujuće mjesto s vjetrovima od 2 km/s i kišom rastopljenog stakla, nazvavši boravak u takvim uvjetima „smrću od tisuću posjekotina“.

min čitanja

Više

Tehnologija

Trajna memorija za Claude Code: Anthropic uvodi Tasks i mijenja način rada AI agenata
Nova funkcija Tasks pretvara Claude Code iz kratkoročnog pomoćnika u trajno svjesnog menadžera projekata, donoseći graf ovisnosti, lokalnu pohranu i dijeljenje stanja među sesijama.

min čitanja

Više

Tehnologija

Anthropic ubacuje popularne poslovne aplikacije u Claude: chatbot postaje radni prostor
Korisnici Claudea od danas mogu izravno unutar chat-prozorčića otvarati alate poput Slacka, Asane ili Canve, što AI asistenta pretvara u sveobuhvatni radni prostor.

min čitanja

Više

Najčitanije

Rukomet

Danci slomili Nijemce i izborili obračun za prolaz
Danska se u Herningu odvojila serijom 6:1 i s 31:26 nadigrala Njemačku, čime je izborila dvoboj koji će odlučiti poredak u skupini.

min čitanja

Više

Skijanje

Četrnaest hrvatskih zimskih nada sprema se za Milano i Cortinu
Hrvatska na ZOI 2026. nastupa s 14 sportaša u četiri sporta, predvođenih najbrojnijim alpskim skijaškim timom.

min čitanja

Više

Nogomet

Varaždin prepravljanjem scenarija šokirao Goricu i zadržao priključak s vrhom
Zaostali dvoboj 19. kola HNL-a preseljen u Veliku Goricu donio je puni plijen gostima: Mamić i Mamut preokrenuli vodstvo Gorice te Varaždinu donijeli skok na šesto mjesto.

min čitanja

Više

Najnovije

Politika

Đakovo diže kredit od 15,3 milijuna € za vrtiće, ceste i rasvjetu

Politika

Obitelji političkih zatvorenika u Venezueli: „Ne odlazimo dok svi ne izađu na slobodu”

Sport

Kad je Hajduk utišao Old Trafford: 6:0 za vječnost

Politika

CDU želi ukinuti opće pravo na skraćeno radno vrijeme: „Tko može raditi više, neka radi više”

Politika

Politički potres u Crnoj Gori zbog eksplicitnih snimki: Vukšić i Pajković brane se optužbama

Vijesti

Monografija i izložba u čast Borisa Papandopula

Tehnologija

Zastoj TikToka podgrijao sumnje u cenzuru nakon preuzimanja od američkih ulagača

Politika

Rutte upozorava na najtežu zimu za Ukrajinu dok ruski napadi gase struju u Harkivu

Vijesti

Čeka se idući unos

Sport

Doktor s Kantride: Nenad Gračan slavi 64. rođendan i prisjeća se prelomnog loma noge

Politika

Parlament u Parizu izglasao zabranu društvenih mreža za mlađe od 15 godina