Tehnologija

31. listopada 2025, 06:21

Znanstvenici otkrili način da „zavrnu” pogreške rezoniranja velikih jezičnih modela

Metoda CRV omogućuje otkrivanje i ispravljanje pogrešaka rezoniranja u velikim jezičnim modelima, čineći ih transparentnijima i pouzdanijima.

min. čitanja

Istraživači iz Meta FAIR-a i Sveučilišta u Edinburghu predstavili su Circuit-based Reasoning Verification (CRV) – tehniku koja ne samo da otkriva kad veliki jezični model pogrešno rezonira, nego i omogućuje trenutnu intervenciju kojom se pogreška ispravlja.

CRV polazi od pretpostavke da modeli zadatke rješavaju putem specijaliziranih „cirkusa” – podgrafova neurona koji funkcioniraju poput skrivenih algoritama. Ako algoritam zakaže, moguće je pronaći mjesto kvara, baš kao kad se u klasičnom softveru analizira trag izvršavanja.

Kako CRV funkcionira

Transkodiranje: istraživači zamjenjuju gusto povezane slojeve transformera tzv. transkoderima, koji prisiljavaju mrežu da međukorake predstavlja rijetkim i semantički čitljivim značajkama.
Graf atribucije: za svaki korak rezoniranja gradi se graf kojim se prati protok informacija između tih značajki i obrađivanih tokena.
Strukturni otisak: iz grafa se izvlače statistike koje služe kao „otisak prsta” dotičnog računalnog koraka.
Dijagnostički klasifikator: model treniran na tim otiscima predviđa je li trenutni korak ispravan.

U trenutku izvođenja klasifikator nadzire aktivacije modela i signalizira kad rezoniranje krene po zlu – a pogrešku se potom može ručno ugušiti ili korigirati.

Empirijska potvrda

Metoda je testirana na Llama 3.1 8B Instruct modelu proširenom transkoderima, i to na sintetičkim logičkim i aritmetičkim zadacima te stvarnim zadacima iz skupa GSM8K. U svim je mjerama CRV nadmašio crne i sive kutije dosadašnjih pristupa, što potvrđuje da dubinski pogled u strukturu modela donosi pouzdaniju detekciju pogrešaka od površinske analize.

• Signali pogreške pokazali su se izrazito domensko specifičnima – klasifikator obučen za logiku loše prenosi na aritmetiku i obrnuto. • U slučaju pogrešne primjene redoslijeda računskih operacija CRV je locirao prenaglo paljenje značajke „množenje”; njezino potiskivanje dovelo je do ispravnog rješenja.

Što to znači za budućnost

Autori ističu da bi atribucijski grafovi mogli postati temelj za nove alate za „debugiranje” umjetne inteligencije. Umjesto skupog ponovnog treniranja, razvojni timovi mogli bi precizno ciljati uzrok pogreške – bilo nedostatak podataka, bilo međusobni sukob različitih zadataka – te primijeniti ciljano fino podešavanje ili čak izravnu uredničku intervenciju u modelu.

Tim planira javno objaviti podatkovne skupove i trenirane transkodere kako bi potaknuo daljnja istraživanja. Ako se CRV pokaže dovoljno robusnim za produkcijske sustave, mogao bi postati ključni korak prema pouzdanijim autonomnim agentima koji, poput ljudi, znaju korigirati vlastite misaone pogreške u hodu.

#sveuciliste-u-edinburghu #edinburgh #meta-fair #crv

Slično

Lifestyle

Veterinari alarmiraju: humanizacija ljubimaca stvara više štete nego koristi

Stručnjaci upozoravaju da pretjerano poistovjećivanje pasa i mačaka s ljudima potiče nepotrebne, skupe zahvate i narušava dobrobit samih životinja.

min čitanja

Više

Tehnologija

Nasa odbacila Kardashianine sumnje: „Na Mjesecu smo bili šest puta”

NASA je preko društvenih mreža otklonila teze Kim Kardashian da je slijetanje Apolla 11 bilo lažirano, podsjetivši kako se na Mjesec vraća s programom Artemis.

min čitanja

Više

Tehnologija

Tri tehnološka mogula platila račun cijelom restoranu u Seulu

Šefovi Nvidije, Samsunga i Hyundaija izazvali su oduševljenje gostiju u Seulu naručivši chimaek za sve i najavivši nove projekte uoči APEC-a.

min čitanja

Više

Tehnologija

OpenAI predstavio Aardvark, autonomnog AI istraživača ranjivosti

GPT-5 agent neprekidno snima svaki commit, provjerava iskorištivost otkrivenih propusta i automatski predlaže zakrpe u GitHubu.

min čitanja

Više

Tehnologija

Vrtić Krijesnica pretvara biootpad u vodu i štedi proračun

Dječji vrtić Krijesnica u Starim Jankovcima nabavio je uređaj za aerobnu digestiju biootpada vrijedan 2 544 eura, zahvaljujući Razvojnoj agenciji TINTL i Fondu za zaštitu okoliša.

min čitanja

Više

Tehnologija

Zadnja godina za povoljan obračun solarne energije: net-metering nestaje 2026.

Za ulazak u povoljan sustav „net-meteringa” ostalo je još godinu dana; od 2026. uvodi se „net-billing” i dulji rok povrata investicije u kućne solarne elektrane.

min čitanja

Više

Tehnologija

Britanski zastupnici uzbunili se zbog navodne krađe intelektualnog vlasništva u Nexperiji

Optužbe da je bivši direktor Nexperije preusmjerio poslovne tajne iz Manchestera u Kinu izazvale su burne reakcije u Londonu i prijete novim poremećajima u automobilskoj industriji.

min čitanja

Više

Tehnologija

Startup iz New Yorka ponovno otvara raspravu o genetski uređenim bebama

Manhattan Genomics najavljuje genetsku korekciju embrija radi liječenja monogenskih bolesti, dok stručnjaci upozoravaju na rizike, etičke prijepore i moguće eugeničke motive.

min čitanja

Više

Tehnologija

Canva lansira kreativni operativni sustav 2.0: AI preuzima rutinu, ljudi ostaju izvor mašte

Platforma poznata po jednostavnom dizajnu uvela je AI u svaki kutak rada, cilja na 250 milijuna korisnika i najavljuje eru u kojoj mašta postaje djelo jednim klikom.

min čitanja

Više

Tehnologija

Gimnazija Vukovar pretvara Dunav u učionicu za zelenu energiju

Vukovarska gimnazija kroz europske projekte SHORE i GeoSave učenike pretvara u ambasadore obnovljive energije, povezujući dunavsku obalu s geotermalnim dubinama i svjetskim znanstvenim centrima.

min čitanja

Više

Najčitanije

Politika

Jandroković na Mirogoju o „sramotnom” lajku Dalije Orešković i odgovornosti za sporni okrugli stol

Predsjednik Sabora osudio je postupak zastupnice Dalije Orešković, objasnio zašto nije zabranio sporni skup o Jasenovcu i poručio da je parlamentarna većina i dalje stabilna.

min čitanja

Više

Nogomet

Pirotehnika skupo stajala klubove u 11. kolu HNL-a

Disciplinski sudac HNL-a izrekao novčane kazne za pirotehniku u 11. kolu: Dinamo 1.800 €, Hajduk 2.000 €, Vukovar 1991 900 €, Gorica i Rijeka po 700 €.

min čitanja

Više

Vijesti

Dvojica Iraca proglašena krivima za brutalno ubojstvo Josipa Štroka u Dublinu

Porota u Dublinu proglasila je Marka Leeja i Anthonyja Delappea krivima za ubojstvo Hrvata Josipa Štroka, dok je Connor Rafferty oslobođen. Izricanje kazne slijedi 17. studenoga.

min čitanja

Više

Vijesti

Desetominutni pljusak paralizirao New York i odnio dva života

Rekordna količina kiše pala je na New York u samo deset minuta, izazvavši poplave, poremećaje u zračnom prometu i smrt dvoje ljudi.

min čitanja

Više

Politika

Milanović Papi Lavu XIV nosi pretisak glagoljskog Misala

Hrvatski predsjednik Zoran Milanović na prvoj službenoj audijenciji kod pape Lava XIV darovat će pretisak glagoljskog Misala, najstarijeg nelatiničnog kršćanskog misala.

min čitanja

Više

Tehnologija

31. listopada 2025, 06:21

Znanstvenici otkrili način da „zavrnu” pogreške rezoniranja velikih jezičnih modela

Metoda CRV omogućuje otkrivanje i ispravljanje pogrešaka rezoniranja u velikim jezičnim modelima, čineći ih transparentnijima i pouzdanijima.

min. čitanja

Kako CRV funkcionira

Transkodiranje: istraživači zamjenjuju gusto povezane slojeve transformera tzv. transkoderima, koji prisiljavaju mrežu da međukorake predstavlja rijetkim i semantički čitljivim značajkama.
Graf atribucije: za svaki korak rezoniranja gradi se graf kojim se prati protok informacija između tih značajki i obrađivanih tokena.
Strukturni otisak: iz grafa se izvlače statistike koje služe kao „otisak prsta” dotičnog računalnog koraka.
Dijagnostički klasifikator: model treniran na tim otiscima predviđa je li trenutni korak ispravan.

U trenutku izvođenja klasifikator nadzire aktivacije modela i signalizira kad rezoniranje krene po zlu – a pogrešku se potom može ručno ugušiti ili korigirati.

Empirijska potvrda

Što to znači za budućnost

#sveuciliste-u-edinburghu #edinburgh #meta-fair #crv

Slično

Lifestyle

Veterinari alarmiraju: humanizacija ljubimaca stvara više štete nego koristi

Stručnjaci upozoravaju da pretjerano poistovjećivanje pasa i mačaka s ljudima potiče nepotrebne, skupe zahvate i narušava dobrobit samih životinja.

min čitanja

Više

Tehnologija

Nasa odbacila Kardashianine sumnje: „Na Mjesecu smo bili šest puta”

NASA je preko društvenih mreža otklonila teze Kim Kardashian da je slijetanje Apolla 11 bilo lažirano, podsjetivši kako se na Mjesec vraća s programom Artemis.

min čitanja

Više

Tehnologija

Tri tehnološka mogula platila račun cijelom restoranu u Seulu

Šefovi Nvidije, Samsunga i Hyundaija izazvali su oduševljenje gostiju u Seulu naručivši chimaek za sve i najavivši nove projekte uoči APEC-a.

min čitanja

Više

Tehnologija

OpenAI predstavio Aardvark, autonomnog AI istraživača ranjivosti

GPT-5 agent neprekidno snima svaki commit, provjerava iskorištivost otkrivenih propusta i automatski predlaže zakrpe u GitHubu.

min čitanja

Više

Tehnologija

Vrtić Krijesnica pretvara biootpad u vodu i štedi proračun

Dječji vrtić Krijesnica u Starim Jankovcima nabavio je uređaj za aerobnu digestiju biootpada vrijedan 2 544 eura, zahvaljujući Razvojnoj agenciji TINTL i Fondu za zaštitu okoliša.

min čitanja

Više

Tehnologija

Zadnja godina za povoljan obračun solarne energije: net-metering nestaje 2026.

Za ulazak u povoljan sustav „net-meteringa” ostalo je još godinu dana; od 2026. uvodi se „net-billing” i dulji rok povrata investicije u kućne solarne elektrane.

min čitanja

Više

Tehnologija

Britanski zastupnici uzbunili se zbog navodne krađe intelektualnog vlasništva u Nexperiji

Optužbe da je bivši direktor Nexperije preusmjerio poslovne tajne iz Manchestera u Kinu izazvale su burne reakcije u Londonu i prijete novim poremećajima u automobilskoj industriji.

min čitanja

Više

Tehnologija

Startup iz New Yorka ponovno otvara raspravu o genetski uređenim bebama

Manhattan Genomics najavljuje genetsku korekciju embrija radi liječenja monogenskih bolesti, dok stručnjaci upozoravaju na rizike, etičke prijepore i moguće eugeničke motive.

min čitanja

Više

Tehnologija

Canva lansira kreativni operativni sustav 2.0: AI preuzima rutinu, ljudi ostaju izvor mašte

Platforma poznata po jednostavnom dizajnu uvela je AI u svaki kutak rada, cilja na 250 milijuna korisnika i najavljuje eru u kojoj mašta postaje djelo jednim klikom.

min čitanja

Više

Tehnologija

Gimnazija Vukovar pretvara Dunav u učionicu za zelenu energiju

Vukovarska gimnazija kroz europske projekte SHORE i GeoSave učenike pretvara u ambasadore obnovljive energije, povezujući dunavsku obalu s geotermalnim dubinama i svjetskim znanstvenim centrima.

min čitanja

Više

Najčitanije

Politika

Jandroković na Mirogoju o „sramotnom” lajku Dalije Orešković i odgovornosti za sporni okrugli stol

Predsjednik Sabora osudio je postupak zastupnice Dalije Orešković, objasnio zašto nije zabranio sporni skup o Jasenovcu i poručio da je parlamentarna većina i dalje stabilna.

min čitanja

Više

Nogomet

Pirotehnika skupo stajala klubove u 11. kolu HNL-a

Disciplinski sudac HNL-a izrekao novčane kazne za pirotehniku u 11. kolu: Dinamo 1.800 €, Hajduk 2.000 €, Vukovar 1991 900 €, Gorica i Rijeka po 700 €.

min čitanja

Više

Vijesti

Dvojica Iraca proglašena krivima za brutalno ubojstvo Josipa Štroka u Dublinu

Porota u Dublinu proglasila je Marka Leeja i Anthonyja Delappea krivima za ubojstvo Hrvata Josipa Štroka, dok je Connor Rafferty oslobođen. Izricanje kazne slijedi 17. studenoga.

min čitanja

Više

Vijesti

Desetominutni pljusak paralizirao New York i odnio dva života

Rekordna količina kiše pala je na New York u samo deset minuta, izazvavši poplave, poremećaje u zračnom prometu i smrt dvoje ljudi.

min čitanja

Više

Politika

Milanović Papi Lavu XIV nosi pretisak glagoljskog Misala

Hrvatski predsjednik Zoran Milanović na prvoj službenoj audijenciji kod pape Lava XIV darovat će pretisak glagoljskog Misala, najstarijeg nelatiničnog kršćanskog misala.

min čitanja

Više