Tehnologija

20. kolovoza 2025, 06:25

Studija sa Sveučilišta Arizona ruši mit o dubokom zaključivanju LLM-ova

Rad ASU-ovih znanstvenika pokazuje da Chain-of-Thought zapravo nije ljudsko zaključivanje nego prepoznavanje obrazaca, te nudi smjernice kako se s tim ograničenjima nositi u poslovnim primjenama.

min. čitanja

Nova studija istraživača sa Sveučilišta Arizona State (ASU) dovodi u pitanje popularnu praksu Chain-of-Thought (CoT) promptiranja, tvrdeći da modeli velikih jezičnih modela (LLM) zapravo ne razmišljaju, već vješto prepoznaju obrasce iz podataka na kojima su trenirani.

Istraživači su razvili okruženje DataAlchemy i testirali manje LLM-ove u tri scenarija „distribucijskog pomaka” – novu vrstu zadatka, drukčiju duljinu rezoniranja te promjenu formata prompta. U sva tri slučaja izvedba se „urušila” čim su modeli izišli iz zone poznatih primjera.

„CoT-ov uspjeh proizlazi ne iz urođene sposobnosti zaključivanja, nego iz mogućnosti uvjetnog generaliziranja na testne primjere koji strukturno nalikuju onima iz treninga”, pišu autori. Dodaju da se izvan tog raspona CoT pretvara u „sofisticiranu varijantu strukturiranog podudaranja uzoraka, fundamentalno ograničenu viđenom distribucijom podataka”.

Ključni nalazi • Na novim zadacima modeli su kopirali najbliže poznate obrasce umjesto da razviju novo logičko rješenje. • Kada je duljina lanca zaključivanja odstupila od naučene, modeli su umjetno dodavali ili skraćivali korake kako bi se vratili na poznatu strukturu. • Minimalne promjene u formatu prompta – primjerice drukčiji redoslijed uputa – drastično su snižavale točnost.

Fine-tuning brzo „krpa” rupe, ali potvrđuje tezu: model ne postaje apstraktniji, nego samo pamti novi uzorak. „Napredak znanosti mora ostati usmjeren na čovjeka – strojevi mogu pomagati, ali otkrića i dalje pokreću ljudska radoznalost i kreativnost”, poručuje koredaktor studije Chengshuai Zhao.

Savjeti za primjenu u tvrtkama

Ne oslanjati se slijepo na CoT u područjima visokog rizika poput financija ili prava; nužan je stručni nadzor.
Provoditi rigorozno testiranje izvan distribucije (OOD) koje sustavno ispituje zadatke, duljine i formate.
Shvaćati fine-tuning kao privremenu zakrpu, a ne rješenje za opću sposobnost rezoniranja.

Autori zaključuju da većina poslovnih primjena ipak može profitirati od LLM-ova, ali samo ako se njihove granice precizno mapiraju i ako se dodatno treniranje koristi „kirurški” – točno ondje gdje evaluacija otkrije slabost. Tako se „fluent nonsense” pretvara u predvidljivu pomoć, a mito o umjetnoj inteligenciji koja „misli kao čovjek” vraća u realne okvire.

#arizona #sveuciliste-arizona-state #dataalchemy #chengshuai-zhao #lanac-zakljucivanja

Slično

Politika

Republikanci i demokrati uoči 2026. ulaze u novu bitku za granice izbornih okruga

Tijesna republikanska većina u Kongresu ovisi o sudskim i zakonodavnim bitkama za prekrajanje izbornih okruga prije izbora 2026.

min čitanja

Više

Tehnologija

Sin započinje utrku protiv vremena kako bi ocu dao „umjetnu besmrtnost”

Emotivna snimka otkriva sinov trud da putem tehnologije ovjekovječi glas teško bolesnog oca.

min čitanja

Više

Tehnologija

OpenAI potpisao golemi ugovor s Amazonom za 38 milijardi dolara

Ugovor vrijedan 38 milijardi dolara s Amazonom osigurava OpenAI-ju stotine tisuća Nvidia GPU-ova i otvara novu fazu rivalstva među tehnološkim divovima.

min čitanja

Više

Tehnologija

Berlinski dltHub prikupio 8 milijuna dolara za alat koji Python programerima daje supermoći

Otvoreni Python paket DLT, koji već koristi više od 5 000 tvrtki, dobio je 8 milijuna dolara za razvoj platforme koja inženjering podataka pretvara u posao za jednog programera.

min čitanja

Više

Tehnologija

Malić frustriran Facebook algoritmom, nišanio fizičara Šibera

Novinar Gordan Malić požalio se da mu Facebook stalno prikazuje objave fizičara Antonija Šibera, što je potaknulo raspravu o algoritmima i slobodi izbora sadržaja.

min čitanja

Više

Tehnologija

Njujorški AUI prikupio 20 milijuna dolara za hibridni AI model Apollo-1

Start-up Augmented Intelligence Inc. zatvorio je mostni krug vrijedan 20 milijuna dolara kako bi ubrzao plasman hibridnog AI modela Apollo-1 na tržište.

min čitanja

Više

Tehnologija

Nestanak tradicionalnih captchi: od iskrivljenih slova do džokstrap slagalice

Klasične captche gotovo su nestale, a nove metode prepoznaju botove u pozadini. Preostali izazovi postaju sve bizarniji – od životinja sa šeširima do džokstrapa koji klizi po ekranu.

min čitanja

Više

Tehnologija

Vinkovci otkrili 131 °C geotermalni izvor, najavljeno jeftinije grijanje

Bušotina na 2 700 metara potvrdila treći veliki geotermalni potencijal u Hrvatskoj; grad se sprema na jeftinije grijanje i zelenu tranziciju.

min čitanja

Više

Tehnologija

NHS testira AI za precizniju terapiju karcinoma prostate

Trogodišnje istraživanje u britanskim bolnicama ispituje može li AI analitički alat preciznije odrediti terapiju raka prostate i skratiti put od dijagnoze do liječenja.

min čitanja

Više

Tehnologija

Na A3 krenula montaža prvih portala za digitalnu naplatu Crolibertas

Prvih sedam portala za beskontaktni sustav naplate cestarine Crolibertas postavlja se na A3 između Popovače i Novske, uz privremenu regulaciju prometa.

min čitanja

Više

Najčitanije

Politika

Plenković optužio Milanovića za omalovažavanje sudaca i blokadu veleposlanika

Premijer prozvao predsjednika zbog uvreda na račun sudaca Vrhovnog suda i blokade imenovanja veleposlanika, a pohvalio napredak u potrazi za nestalim braniteljima i usporavanje inflacije.

min čitanja

Više

Nogomet

Dinamo tuguje: preminuo legendarni Rudolf Belin

Preminuo Rudolf „Rudi” Belin, simbol Dinama i član momčadi koja je 1967. osvojila Kup velesajamskih gradova.

min čitanja

Više

Vaterpolo

Barakude započele misiju Beograd: Tucak okupio 23 igrača i otkrio plan priprema

Hrvatska vaterpolska reprezentacija krenula je s pripremama za Europsko prvenstvo 2026.; Tucak pozvao 23 igrača i predstavio detaljan raspored do Beograda.

min čitanja

Više

Politika

Vili Beroš ponovno u operacijskoj sali: povratak bivšeg ministra izazvao podijeljene reakcije

Bivši ministar zdravstva, optužen u aferi „Mikroskop”, vraća se neurokirurgiji u KBC-u Sestre milosrdnice nakon sedam godina pauze. Reakcije su podijeljene.

min čitanja

Više

Tehnologija

20. kolovoza 2025, 06:25

Studija sa Sveučilišta Arizona ruši mit o dubokom zaključivanju LLM-ova

Rad ASU-ovih znanstvenika pokazuje da Chain-of-Thought zapravo nije ljudsko zaključivanje nego prepoznavanje obrazaca, te nudi smjernice kako se s tim ograničenjima nositi u poslovnim primjenama.

min. čitanja

Savjeti za primjenu u tvrtkama

Ne oslanjati se slijepo na CoT u područjima visokog rizika poput financija ili prava; nužan je stručni nadzor.
Provoditi rigorozno testiranje izvan distribucije (OOD) koje sustavno ispituje zadatke, duljine i formate.
Shvaćati fine-tuning kao privremenu zakrpu, a ne rješenje za opću sposobnost rezoniranja.

#arizona #sveuciliste-arizona-state #dataalchemy #chengshuai-zhao #lanac-zakljucivanja

Slično

Politika

Republikanci i demokrati uoči 2026. ulaze u novu bitku za granice izbornih okruga

Tijesna republikanska većina u Kongresu ovisi o sudskim i zakonodavnim bitkama za prekrajanje izbornih okruga prije izbora 2026.

min čitanja

Više

Tehnologija

Sin započinje utrku protiv vremena kako bi ocu dao „umjetnu besmrtnost”

Emotivna snimka otkriva sinov trud da putem tehnologije ovjekovječi glas teško bolesnog oca.

min čitanja

Više

Tehnologija

OpenAI potpisao golemi ugovor s Amazonom za 38 milijardi dolara

Ugovor vrijedan 38 milijardi dolara s Amazonom osigurava OpenAI-ju stotine tisuća Nvidia GPU-ova i otvara novu fazu rivalstva među tehnološkim divovima.

min čitanja

Više

Tehnologija

Berlinski dltHub prikupio 8 milijuna dolara za alat koji Python programerima daje supermoći

Otvoreni Python paket DLT, koji već koristi više od 5 000 tvrtki, dobio je 8 milijuna dolara za razvoj platforme koja inženjering podataka pretvara u posao za jednog programera.

min čitanja

Više

Tehnologija

Malić frustriran Facebook algoritmom, nišanio fizičara Šibera

Novinar Gordan Malić požalio se da mu Facebook stalno prikazuje objave fizičara Antonija Šibera, što je potaknulo raspravu o algoritmima i slobodi izbora sadržaja.

min čitanja

Više

Tehnologija

Njujorški AUI prikupio 20 milijuna dolara za hibridni AI model Apollo-1

Start-up Augmented Intelligence Inc. zatvorio je mostni krug vrijedan 20 milijuna dolara kako bi ubrzao plasman hibridnog AI modela Apollo-1 na tržište.

min čitanja

Više

Tehnologija

Nestanak tradicionalnih captchi: od iskrivljenih slova do džokstrap slagalice

Klasične captche gotovo su nestale, a nove metode prepoznaju botove u pozadini. Preostali izazovi postaju sve bizarniji – od životinja sa šeširima do džokstrapa koji klizi po ekranu.

min čitanja

Više

Tehnologija

Vinkovci otkrili 131 °C geotermalni izvor, najavljeno jeftinije grijanje

Bušotina na 2 700 metara potvrdila treći veliki geotermalni potencijal u Hrvatskoj; grad se sprema na jeftinije grijanje i zelenu tranziciju.

min čitanja

Više

Tehnologija

NHS testira AI za precizniju terapiju karcinoma prostate

Trogodišnje istraživanje u britanskim bolnicama ispituje može li AI analitički alat preciznije odrediti terapiju raka prostate i skratiti put od dijagnoze do liječenja.

min čitanja

Više

Tehnologija

Na A3 krenula montaža prvih portala za digitalnu naplatu Crolibertas

Prvih sedam portala za beskontaktni sustav naplate cestarine Crolibertas postavlja se na A3 između Popovače i Novske, uz privremenu regulaciju prometa.

min čitanja

Više

Najčitanije

Politika

Plenković optužio Milanovića za omalovažavanje sudaca i blokadu veleposlanika

Premijer prozvao predsjednika zbog uvreda na račun sudaca Vrhovnog suda i blokade imenovanja veleposlanika, a pohvalio napredak u potrazi za nestalim braniteljima i usporavanje inflacije.

min čitanja

Više

Nogomet

Dinamo tuguje: preminuo legendarni Rudolf Belin

Preminuo Rudolf „Rudi” Belin, simbol Dinama i član momčadi koja je 1967. osvojila Kup velesajamskih gradova.

min čitanja

Više

Vaterpolo

Barakude započele misiju Beograd: Tucak okupio 23 igrača i otkrio plan priprema

Hrvatska vaterpolska reprezentacija krenula je s pripremama za Europsko prvenstvo 2026.; Tucak pozvao 23 igrača i predstavio detaljan raspored do Beograda.

min čitanja

Više

Politika

Vili Beroš ponovno u operacijskoj sali: povratak bivšeg ministra izazvao podijeljene reakcije

Bivši ministar zdravstva, optužen u aferi „Mikroskop”, vraća se neurokirurgiji u KBC-u Sestre milosrdnice nakon sedam godina pauze. Reakcije su podijeljene.

min čitanja

Više