CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

20. kolovoza 2025, 06:25

Studija sa Sveučilišta Arizona ruši mit o dubokom zaključivanju LLM-ova

Rad ASU-ovih znanstvenika pokazuje da Chain-of-Thought zapravo nije ljudsko zaključivanje nego prepoznavanje obrazaca, te nudi smjernice kako se s tim ograničenjima nositi u poslovnim primjenama.

min. čitanja

XFacebookWhatsApp

Nova studija istraživača sa Sveučilišta Arizona State (ASU) dovodi u pitanje popularnu praksu Chain-of-Thought (CoT) promptiranja, tvrdeći da modeli velikih jezičnih modela (LLM) zapravo ne razmišljaju, već vješto prepoznaju obrasce iz podataka na kojima su trenirani.

Istraživači su razvili okruženje DataAlchemy i testirali manje LLM-ove u tri scenarija „distribucijskog pomaka” – novu vrstu zadatka, drukčiju duljinu rezoniranja te promjenu formata prompta. U sva tri slučaja izvedba se „urušila” čim su modeli izišli iz zone poznatih primjera.

„CoT-ov uspjeh proizlazi ne iz urođene sposobnosti zaključivanja, nego iz mogućnosti uvjetnog generaliziranja na testne primjere koji strukturno nalikuju onima iz treninga”, pišu autori. Dodaju da se izvan tog raspona CoT pretvara u „sofisticiranu varijantu strukturiranog podudaranja uzoraka, fundamentalno ograničenu viđenom distribucijom podataka”.

Ključni nalazi • Na novim zadacima modeli su kopirali najbliže poznate obrasce umjesto da razviju novo logičko rješenje. • Kada je duljina lanca zaključivanja odstupila od naučene, modeli su umjetno dodavali ili skraćivali korake kako bi se vratili na poznatu strukturu. • Minimalne promjene u formatu prompta – primjerice drukčiji redoslijed uputa – drastično su snižavale točnost.

Fine-tuning brzo „krpa” rupe, ali potvrđuje tezu: model ne postaje apstraktniji, nego samo pamti novi uzorak. „Napredak znanosti mora ostati usmjeren na čovjeka – strojevi mogu pomagati, ali otkrića i dalje pokreću ljudska radoznalost i kreativnost”, poručuje koredaktor studije Chengshuai Zhao.

Savjeti za primjenu u tvrtkama

  1. Ne oslanjati se slijepo na CoT u područjima visokog rizika poput financija ili prava; nužan je stručni nadzor.
  2. Provoditi rigorozno testiranje izvan distribucije (OOD) koje sustavno ispituje zadatke, duljine i formate.
  3. Shvaćati fine-tuning kao privremenu zakrpu, a ne rješenje za opću sposobnost rezoniranja.

Autori zaključuju da većina poslovnih primjena ipak može profitirati od LLM-ova, ali samo ako se njihove granice precizno mapiraju i ako se dodatno treniranje koristi „kirurški” – točno ondje gdje evaluacija otkrije slabost. Tako se „fluent nonsense” pretvara u predvidljivu pomoć, a mito o umjetnoj inteligenciji koja „misli kao čovjek” vraća u realne okvire.

#arizona#sveuciliste-arizona-state#dataalchemy#chengshuai-zhao#lanac-zakljucivanja

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Arcee predstavio Trinity Large: 400-milijardni model otvorenog koda s rekordnom učinkovitošću
Arcee je lansirao Trinity Large, 400-milijardni MoE jezični model, te ponudio sirovi checkpoint TrueBase za neovisne revizije i prilagodbe.

min čitanja

Više

Tehnologija

PageIndex uvodi „navigacijsko” pretraživanje i podiže točnost RAG-a za duge dokumente
Otvoreni okvir PageIndex zamjenjuje klasično „chunk-and-embed” indeksiranje stablom sadržaja, čime poboljšava preciznost AI-a pri pretraživanju vrlo dugih i složenih dokumenata.

min čitanja

Više

Tehnologija

Rimac u St. Moritzu predstavio prvu Neveru R Founderʼs Edition
Na zaleđenom jezeru St. Moritz Rimac je isporučio prvi od svega deset primjeraka ekskluzivne Nevere R Founderʼs Edition, hiperautomobila od 2107 KS rasprodanog u tjedan dana.

min čitanja

Više

Tehnologija

Tehnološki lideri ujedinjeni protiv praksi ICE-a
Otvoreno pismo zaposlenika i šefova iz Silicijske doline poziva na prekid suradnje s američkom imigracijskom službom zbog nasilnih metoda.

min čitanja

Više

Tehnologija

Aplikacija Mobile Fortify širi ovlasti ICE-a: upozorenje na opasnu kombinaciju nadzora i pristranosti
Mobilna aplikacija ICE-a prikuplja biometrijske podatke i na američkim državljanima, čuva ih 15 godina i pokazuje velike stope pristranosti, upozoravaju tužbe i stručnjaci.

min čitanja

Više

Tehnologija

Nizozemski regulator pokrenuo istragu protiv Robloxa zbog zaštite djece
ACM sumnja da popularna platforma ne poštuje odredbe DSA-a o sigurnosti maloljetnika i najavljuje moguću novčanu kaznu.

min čitanja

Više

Tehnologija

Kimi K2.5 izazvao buru: kineski tim na Redditu otkrio muke otvorenog koda
Trosatni AMA otkrio je skrivena lica najmoćnijeg otvorenog AI modela s fokusom na konkretne tehničke probleme i dilemu oko potpune otvorenosti.

min čitanja

Više

Tehnologija

Trgovci se okreću rubnom računalstvu za otpornije i brže poslovanje
Rubno računalstvo postaje ključan alat za trgovce koji se bore s višestrukim izazovima, od nestašice radnika do kibernetičkih prijetnji.

min čitanja

Više

Tehnologija

Hrvatski tim otkrio vezu kvara popravka genoma i ranog raka jetre
Istraživači pod vodstvom Ivana Đikića otkrili su kako genomski kvar potiče kroničnu upalu, rano starenje i razvoj karcinoma jetre.

min čitanja

Više

Tehnologija

Google tvrdi da umjetna inteligencija bolje rezonira kada u sebi vodi „društvo misli”
Googleovo istraživanje otkriva da LLM-ovi postižu bolje rezultate kad unutarnje simuliraju rasprave više "personâ", povećavajući kognitivnu raznolikost i smanjujući pristranost.

min čitanja

Više

Najčitanije

Vijesti

Preminula Catherine O’Hara, nezaboravna majka iz filma „Sam u kući”
Glumica Catherine O’Hara, poznata po ulozi majke u „Samu u kući”, umrla je u 71. godini; uzrok smrti zasad nije objavljen.

min čitanja

Više

Nogomet

Remi u Puli: Istra 1961 i Lokomotiva podijelile bodove u 20. kolu HNL-a
Puljani poveli preko Prevljaka, Zagrepčani izjednačili golom Vukovića; vratari spriječili odluku u završnici.

min čitanja

Više

Politika

EPP u Zagrebu: demografija mora postati strateški prioritet EU-a
Na skupu u Zagrebu EPP usvojio deklaraciju kojom upozorava da Europa bez demografske obnove gubi snagu i poziva na zajedničku strategiju EU-a.
Autor European People's Party - EPP Summit, 24 March 2022, Brussels, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=138912279

min čitanja

Više

Vijesti

H5N1 potvrđen u trima labudovima: uvedene strože mjere za perad u cijeloj zemlji
Ministarstvo poljoprivrede potvrdilo pojavu visokopatogenog virusa ptičje gripe H5N1 u Koprivničko-križevačkoj županiji te uvelo pojačane mjere biosigurnosti za perad u cijeloj Hrvatskoj.

min čitanja

Više

Najnovije

Vijesti

Novogradiški policajci usavršili vještine prve pomoći

Biznis

Marčana pokreće poduzetnički inkubator vrijedan 1,1 milijun eura

Sport

Samoborski „Pedalinci” kreću biciklima prema Olimpijadi u Cortini

Lifestyle

Hip-hop eksplozija otvara Rocks & Stars: Hiljson Mandela, Grše i Rasta u antičkom kamenolomu

Vijesti

Balkanski kamiondžije maknuli blokade nakon europskog obećanja

Lifestyle

Veljača u Puli pretvara grad u veliko karnevalsko i glazbeno središte

Vijesti

Građani Plokita razočarani: linija 19 opet odgođena

Vijesti

KBC Osijek: bolnica tvrdi da uhićenje liječnika nema veze s otkazom kolegi

Lifestyle

Vinkovačko predavanje otkrilo kako je Kralj Tomislav oblikovao hrvatsku umjetnost

Vijesti

Autobusi 4 i 4a ponovno voze redovnom trasom

Biznis

Trump gura Kevina Warsha na čelo FED-a usred borbe za neovisnost