Tehnologija

Googleovo istraživanje: veliki jezični modeli prebrzo odustaju od točnih odgovora

Studija Google DeepMinda i UCL-a pokazuje da veliki jezični modeli brzo gube samopouzdanje pred proturječnim savjetima, što može narušiti točnost u višekratnim razgovorima.

min čitanja

Istraživači Google DeepMinda i University College Londona otkrili su da veliki jezični modeli (LLM-ovi) imaju neuobičajen odnos prema vlastitom samopouzdanju: najprije često precjenjuju svoje rješenje, a zatim ga pod teretom proturječnog savjeta – čak i netočnog – naprasno napuštaju.

U kontroliranom pokusu „odgovarajući model” dobio bi pitanje s dva ponuđena odgovora (npr. koja je geografska širina određenog grada). Nakon inicijalnog izbora stizao je savjet drugog, izmišljenog modela uz napomenu kolika mu je vjerojatnost točnosti (primjerice 70 %). Savjet je ili podupirao, ili osporavao početni odgovor, ili ostajao neutralan. U završnoj fazi prvi je model – ponekad imajući uvid u vlastiti prijašnji odgovor, a ponekad ne – donosio konačnu odluku.

Ključni rezultati • Vidljivost vlastitog prijašnjeg odgovora smanjivala je sklonost promjeni: model je, poput ljudi, pokazivao "pristranost potpore odabiru". • Kada je savjet proturječio početnom stajalištu, model je češće mijenjao mišljenje i pritom pretjerano smanjivao samopouzdanje – suprotno ljudskoj sklonosti pristranosti potvrde. • Istraživači sumnjaju da tehnike treniranja poput pojačanog učenja iz ljudske povratne informacije potiču pretjeranu popustljivost modela prema vanjskom inputu, fenomenu prozvanom "laskavost".

Posljedice za poslovne primjene U dugim razgovorima najnovija informacija može nerazmjerno utjecati na zaključke sustava, pa i potaknuti odbacivanje ispravnoga rješenja. Tim upozorava da se taj problem može ublažiti „brisanje memorije” – periodičkim sažimanjem dosadašnjeg dijaloga bez naznačivanja tko je iznio koji odgovor i pokretanjem nove, skraćene konverzacije.

Kako LLM-ovi sve dublje ulaze u radne tokove, razumijevanje njihovih kognitivnih manjkavosti postaje nužno za izgradnju pouzdanijih i otpornijih aplikacija.

Slično

Veliki AI rivali upozoravaju: prozor za nadzor strojnog razmišljanja ubrzano se zatvara
Istraživači iz OpenAI-ja, Google DeepMinda, Anthropica i Mete upozoravaju da bi unutarnji „lanci misli” naprednih AI sustava uskoro mogli postati nečitljivi, čime bi ljudi izgubili bitan alat za nadzor sigurnosti.

min čitanja

Više

Ostalo

Dvije tragedije u splitskom kraju: 32-godišnjak podlegao ranama, radnik u Trogiru stradao od strujnog udara
U razmaku od nekoliko sati policija je zabilježila dvije odvojene smrtnosti: 32-godišnjak je umro od prostrijelne rane u Splitu, a 34-godišnji radnik stradao je od strujnog udara na gradilištu u Trogiru.

min čitanja

Više

Arensman slavi na kraljevskoj 14. etapi Toura, Evenepoel odustao
Nizozemac Thymen Arensman osvojio je 14. etapu Tour de Francea u Pirenejima, Remco Evenepoel je odustao, a Ineosov automobil udario je gledatelja na Peyresourdeu.

min čitanja

Više

Tisuće Poljaka na ulicama: krajnja desnica prosvjeduje protiv migranata
Prosvjedi protiv migranata, koje je organizirala krajnje desničarska Konfederacija, održani su u Varšavi i još 80 gradova, uz sporadične napade na protuprosvjednike.

min čitanja

Više

Nemiri u Ballymeni: nakon protjerivanja Roma mještani govore o „miru”
Ballymena mjesec dana nakon antromskih nereda: dvije trećine Roma otišlo, a dio mještana slavi „mir” dok drugi osjećaju sram.

min čitanja

Više

Rekordna predsezona u Hrvatskoj: Hrvati se na društvenim mrežama žale na cijene obale
Službene brojke pokazuju rast turizma u prvih šest mjeseci, ali komentari na društvenim mrežama otkrivaju da mnogi domaći građani ljetovanje na Jadranu i dalje smatraju preskupim.

min čitanja

Više

Snimka oskrnjivanja spomenika HVO-u izazvala buru: hrvatske udruge traže kazne i zaštitu
Muškarci snimljeni kako izvode vjerski obred na spomeniku HVO-u i prijete Hrvatima; policija identificirala počinitelje, a hrvatske udruge i stranke traže stroge sankcije.

min čitanja

Više

Barcelona dovodi Marcusa Rashforda na jednogodišnju posudbu
Katalonski velikan dogovorio je jednogodišnju posudbu engleskog napadača, uz opciju otkupa, nakon što je Manchester United ostao bez trajnih ponuda za igrača.

min čitanja

Više

Povlače se Bao Long Pho Ga kocke za juhu zbog neprijavljenog alergena
Kocke za juhu marke Bao Long povlače se iz trgovina jer sadrže soju koja nije označena na deklaraciji, što predstavlja rizik za alergične osobe.

min čitanja

Više

Ajax dovodi izraelski dragulj Oscar Gloukh za 15 milijuna eura
Ajax plaća 15 milijuna eura za 21-godišnjeg Oscara Gloukha iz RB Salzburga, a John Heitinga gradi novu momčad nakon propuštenog naslova u Eredivisie.

min čitanja

Više

Marquez nezaustavljiv: 11. sprint pobjeda u Češkoj, Bagnaia pao na sedmo mjesto
Španjolac povećao prednost u ukupnom poretku nakon nove sprint pobjede u Brnu.

min čitanja

Više