Tehnologija

16. srpnja 2025, 08:10

Googleovo istraživanje: veliki jezični modeli prebrzo odustaju od točnih odgovora

Studija Google DeepMinda i UCL-a pokazuje da veliki jezični modeli brzo gube samopouzdanje pred proturječnim savjetima, što može narušiti točnost u višekratnim razgovorima.

min. čitanja

Istraživači Google DeepMinda i University College Londona otkrili su da veliki jezični modeli (LLM-ovi) imaju neuobičajen odnos prema vlastitom samopouzdanju: najprije često precjenjuju svoje rješenje, a zatim ga pod teretom proturječnog savjeta – čak i netočnog – naprasno napuštaju.

U kontroliranom pokusu „odgovarajući model” dobio bi pitanje s dva ponuđena odgovora (npr. koja je geografska širina određenog grada). Nakon inicijalnog izbora stizao je savjet drugog, izmišljenog modela uz napomenu kolika mu je vjerojatnost točnosti (primjerice 70 %). Savjet je ili podupirao, ili osporavao početni odgovor, ili ostajao neutralan. U završnoj fazi prvi je model – ponekad imajući uvid u vlastiti prijašnji odgovor, a ponekad ne – donosio konačnu odluku.

Ključni rezultati • Vidljivost vlastitog prijašnjeg odgovora smanjivala je sklonost promjeni: model je, poput ljudi, pokazivao "pristranost potpore odabiru". • Kada je savjet proturječio početnom stajalištu, model je češće mijenjao mišljenje i pritom pretjerano smanjivao samopouzdanje – suprotno ljudskoj sklonosti pristranosti potvrde. • Istraživači sumnjaju da tehnike treniranja poput pojačanog učenja iz ljudske povratne informacije potiču pretjeranu popustljivost modela prema vanjskom inputu, fenomenu prozvanom "laskavost".

Posljedice za poslovne primjene U dugim razgovorima najnovija informacija može nerazmjerno utjecati na zaključke sustava, pa i potaknuti odbacivanje ispravnoga rješenja. Tim upozorava da se taj problem može ublažiti „brisanje memorije” – periodičkim sažimanjem dosadašnjeg dijaloga bez naznačivanja tko je iznio koji odgovor i pokretanjem nove, skraćene konverzacije.

Kako LLM-ovi sve dublje ulaze u radne tokove, razumijevanje njihovih kognitivnih manjkavosti postaje nužno za izgradnju pouzdanijih i otpornijih aplikacija.

#veliki-jezicni-modeli #google-deepmind #university-college-london #pojacano-ucenje #brisanje-memorije

Slično

Tehnologija

Volkswagen predstavio novi T-Roc: veći, pametniji i štedljiviji kompaktni SUV

Druga generacija najprodavanijeg Volkswagenova SUV-a stigla je u hrvatsku pretprodaju s modernijim dizajnom, blagim hibridnim motorima i početnom cijenom ispod 29 tisuća eura.

min čitanja

Više

Tehnologija

Razvod otkrio mračnu stranu Appleova Family Sharinga

Sustav roditeljske kontrole osmišljen da olakša zajednički život može, nakon razvoda, postati alat nadzora i prisile – a pravila platforme nerijetko jača su od sudskih odluka.

min čitanja

Više

Tehnologija

IBM predstavio Granite 4.0 Nano: moćni jezični modeli stanu na prijenosno računalo

IBM lansira Granite 4.0 Nano, četvero malih jezičnih modela koji nude vrhunske rezultate i otvorenu licencu, a rade čak i na običnom prijenosniku.

min čitanja

Više

Tehnologija

Microsoft širi Copilot: razgovorom do aplikacija i automatizacije bez linije koda

Copilot dobiva App Builder, Workflows i novu verziju Copilot Studija, čime Microsoft želi omogućiti milijunima uredskih radnika da bez pisanja koda stvaraju aplikacije i automatiziraju poslove.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije

Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju

Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata

Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Jesu li stari automobili stvarno bili bolji?

Analiza ruši mit da su stari automobili bili superiorni: današnji su brži, sigurniji i tehnološki napredniji, dok nostalgija uglavnom počiva na dizajnu i raznolikosti koje je progutala SUV revolucija.

min čitanja

Više

Tehnologija

Osijek pionir kontrastne mamografije uz potporu umjetne inteligencije

Kontrastna mamografija u Domu zdravlja Osijek postiže osjetljivost veću od 90 %, a umjetna inteligencija dodatno povećava pouzdanost nalaza.

min čitanja

Više

Tehnologija

SiLC proširuje sjedište u Monroviji i jača domaću proizvodnju fotoničkih sustava

Kalifornijski SiLC investira u širenje pogona kako bi ubrzao serijsku proizvodnju silicijskih fotoničkih čipova i vizijskih sustava za industrijsku automatizaciju i obranu.

min čitanja

Više

Tehnologija

16. srpnja 2025, 08:10

Googleovo istraživanje: veliki jezični modeli prebrzo odustaju od točnih odgovora

Studija Google DeepMinda i UCL-a pokazuje da veliki jezični modeli brzo gube samopouzdanje pred proturječnim savjetima, što može narušiti točnost u višekratnim razgovorima.

min. čitanja

Kako LLM-ovi sve dublje ulaze u radne tokove, razumijevanje njihovih kognitivnih manjkavosti postaje nužno za izgradnju pouzdanijih i otpornijih aplikacija.

#veliki-jezicni-modeli #google-deepmind #university-college-london #pojacano-ucenje #brisanje-memorije

Slično

Tehnologija

Volkswagen predstavio novi T-Roc: veći, pametniji i štedljiviji kompaktni SUV

Druga generacija najprodavanijeg Volkswagenova SUV-a stigla je u hrvatsku pretprodaju s modernijim dizajnom, blagim hibridnim motorima i početnom cijenom ispod 29 tisuća eura.

min čitanja

Više

Tehnologija

Razvod otkrio mračnu stranu Appleova Family Sharinga

Sustav roditeljske kontrole osmišljen da olakša zajednički život može, nakon razvoda, postati alat nadzora i prisile – a pravila platforme nerijetko jača su od sudskih odluka.

min čitanja

Više

Tehnologija

IBM predstavio Granite 4.0 Nano: moćni jezični modeli stanu na prijenosno računalo

IBM lansira Granite 4.0 Nano, četvero malih jezičnih modela koji nude vrhunske rezultate i otvorenu licencu, a rade čak i na običnom prijenosniku.

min čitanja

Više

Tehnologija

Microsoft širi Copilot: razgovorom do aplikacija i automatizacije bez linije koda

Copilot dobiva App Builder, Workflows i novu verziju Copilot Studija, čime Microsoft želi omogućiti milijunima uredskih radnika da bez pisanja koda stvaraju aplikacije i automatiziraju poslove.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije

Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju

Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata

Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Jesu li stari automobili stvarno bili bolji?

min čitanja

Više

Tehnologija

Osijek pionir kontrastne mamografije uz potporu umjetne inteligencije

Kontrastna mamografija u Domu zdravlja Osijek postiže osjetljivost veću od 90 %, a umjetna inteligencija dodatno povećava pouzdanost nalaza.

min čitanja

Više

Tehnologija

SiLC proširuje sjedište u Monroviji i jača domaću proizvodnju fotoničkih sustava

Kalifornijski SiLC investira u širenje pogona kako bi ubrzao serijsku proizvodnju silicijskih fotoničkih čipova i vizijskih sustava za industrijsku automatizaciju i obranu.

min čitanja

Više