CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCYPolitika privatnosti

Tehnologija

14. lipnja 2025, 08:26

Apple izazvao buru: jesu li LLM-ovi doista sposobni zaključivati?

Appleov istraživački rad o (ne)sposobnosti LLM-ova za zaključivanje izazvao je val kritika i suprotni studij koji tvrdi da su padovi performansi zapravo rezultat loše postavljenih testova, a ne manjka „inteligencije” modela.

min čitanja

Appleova istraživačka skupina za strojno učenje objavila je rad „The Illusion of Thinking” i potaknula žestoku raspravu u zajednici umjetne inteligencije. U 53 stranice autori tvrde da modeli za tzv. veliko rezoniranje – poput OpenAI-jeva „o” niza ili Googleova Gemini-2.5 Pro – ne „razmišljaju” nego naprosto prepoznaju obrasce te posustaju čim se zadaci zakompliciraju.

Kako je izgledalo Appleovo testiranje

• Istraživači su modele suočili s klasikom kognitivnih i AI-puzzli: Tower of Hanoi, Blocks World, River Crossing i Checkers Jumping. • Svaka je zagonetka zahtijevala višekorakno planiranje i objašnjenje logike putem chain-of-thought upita. • Što su zadaci postajali složeniji, to je točnost padala; na najtežoj razini modeli su pali na nulu. • Istodobno su se skraćivali „tragovi razmišljanja” (broj tokena), što je Apple protumačio kao odustajanje od rješavanja.

Kritike: problem je u tokenima, ne u logici

Na X-u (bivšem Twitteru) brojni su stručnjaci osporili metodologiju.

• @scaling01 ukazao je da Tower of Hanoi eksponencijalno povećava veličinu izlaza: „S više od 13 diskova svi modeli imaju 0 % jer fizički ne mogu ispisati toliko!” • Kritičari su primijetili da Apple nije usporedio rezultate s ljudskim sudionicima, pa nije jasno gube li i ljudi preciznost bez bilješki. • Neki su sugerirali da tvrtka, zaostala za OpenAI-jem i Googleom, možda nastoji spustiti ljestvicu očekivanja.

Rebuttal: „The Illusion of the Illusion of Thinking”

Neovisni istraživač Alex Lawsen i model Claude Opus 4 objavili su odgovor tvrdeći da su „kolapsi” rezultat loše postavljenog testa.

• Appleov skript označavao je rješenja netočnima čim bi modeli premašili ograničenje tokena, iako je strategija bila točna. • Kad su smjeli dati sažet, programerski odgovor – primjerice Lua funkciju koja generira korake Tower of Hanoija – modeli su uspješno riješili daleko složenije verzije problema.

Zašto je važno za poduzeća

Rasprava otkriva da je dizajn evaluacije jednako presudan kao i arhitektura modela.

  1. Dugi lančani zadaci mogu se „slomiti” ne zbog manjka logike, nego zbog premale radne memorije ili prevelikog zahtjeva za eksplicitnim ispisom.
  2. Poduzeća koja grade agente ili kopilote trebaju razmotriti vanjsko spremište memorije, podjelu zadataka u manje cjeline ili komprimirane izlaze (kod umjesto teksta).
  3. Sintetički benchmark ne smije biti jedino mjerilo; realni slučajevi uporabe često traže drugačiji oblik odgovora.

Zaključak

Umjesto definitivnog presuđivanja o „kraju” rezoniranja u LLM-ovima, aktualna polemika naglašava koliko su format pitanja, ograničenja tokena i kriteriji ocjenjivanja ključni za procjenu stvarnih sposobnosti modela. Prije nego što se proglasi proboj – ili fijasko – potrebno je provjeriti je li problem možda u kutiji u koju smo model smjestili, a ne u samom modelu.

#google#apple#openai#claude-opus-4#alex-lawsen
View post on X
View post on X
View post on X
View post on X
View post on X
View post on X

Slično

Tehnologija

Google pristao potpisati dobrovoljni EU kodeks za generativnu umjetnu inteligenciju
Google postaje najveći potpisnik novog EU kodeksa za generativnu AI, dok Meta ostaje po strani.

min čitanja

Više

Tehnologija

Meta obustavlja političko oglašavanje u EU od listopada 2025.
Meta će, prateći Google, od 10. listopada 2025. ukinuti sve plaćene političke i društvene oglase na Facebooku i Instagramu u Europskoj uniji zbog nove EU regulative o transparentnosti političkog oglašavanja.

min čitanja

Više

Tehnologija

Google mora platiti 12 500 dolara Argentincu snimljenom golim na Street Viewu
Žalbeni sud u Argentini dosudio je policajcu odštetu jer ga je Google Street View 2017. snimio golog u vlastitom dvorištu, što je kasnije završilo na televiziji i društvenim mrežama.

min čitanja

Više

Tehnologija

Američki sud stao uz Apple: iCloud+ paketi nisu obmanjivali korisnike
Apelacijski sud u San Franciscu potvrdio je da je Apple jasno komunicirao kapacitet iCloud+ paketa, odbacivši tvrdnje korisnika da su zakinuti za prostor pohrane.

min čitanja

Više

Tehnologija

Altman pred Kongresom: AI briše poslove, ali otvara nova vrata
Šef OpenAI-ja pred američkim Kongresom iznio je upozorenja i prijedloge o regulaciji umjetne inteligencije, ističući da će AI ukinuti neka radna mjesta, ali otvoriti nove profesionalne prilike.

min čitanja

Više

Ostalo

Vijesti

Izvađena „Kruna mora“ iz splitske luke, brodari skupili 63 tisuće eura pomoći
Brod „Kruna mora“ izvučen je iz splitske gradske luke 22 dana nakon potonuća; kolege brodari vlasniku Damiru Kordiću donirali su 63 850 eura.

min čitanja

Više

Lifestyle

Šajetina himna šalterima postala hit: „Idemo na mer” u pet dana do 100.000 pregleda
Nova satirična pjesma Dražena Turine Šajete, posvećena hrvatskoj birokraciji, u pet dana dosegnula je 100.000 pregleda na YouTubeu.

min čitanja

Više

Vijesti

U Istri razotkriven dvojac pljačkaša: krali suhomesnate delicije i alkohol, jednog zatekli s kokainom
Porečka policija uhitila je dvojicu muškaraca zbog krađa suhomesnatih proizvoda i alkohola u Vrsaru i Poreču; jednog je tereti i posjedovanje kokaina.

min čitanja

Više

Lifestyle

„Taste Mediterranean” stiže na Kvarner: Mali Lošinj pretvara se u kulinarsku pozornicu
Mali Lošinj sredinom rujna postaje središte mediteranske gastronomije – premijerno izdanje festivala „Taste Mediterranean” na Kvarneru okuplja vrhunske chefove, ugostitelje i učenike.

min čitanja

Više

Vijesti

Rijeka nabavila novi kombi za prijevoz osoba s invaliditetom
Treći specijalizirani kombi, vrijedan gotovo 60 tisuća eura, olakšat će mobilnost 476 korisnika programa prijevoza osoba s invaliditetom u Rijeci.

min čitanja

Više

Politika

Starijim Britancima prijeti 14 godina zatvora zbog potpore skupini Palestine Action
Oko 200 ljudi, među njima i umirovljeni svećenici i učitelji, uhićeno je u Velikoj Britaniji zbog javne potpore skupini Palestine Action, zabranjenoj kao teroristička organizacija.

min čitanja

Više

Politika

Macron hvali carinski sporazum s SAD-om, ali upozorava: „Prvi korak, ne kraj priče”
Francuski predsjednik pozdravlja dogovor s Washingtonom, no naglašava da pregovori tek počinju.

min čitanja

Više

Politika

Načelnica Matulja prelazi s volonterskog na profesionalni mandat
Ingrid Debeuc od kraja kolovoza više neće biti volonterska načelnica Matulja; Općinsko vijeće imenovalo članove svih odbora.

min čitanja

Više

Politika

Bruxelles pritišće Kijev zbog blokade imenovanja šefa Ureda za ekonomsku sigurnost
Europska komisija upozorila je Ukrajinu da riskira financijske gubitke zbog odbijanja da imenuje Oleksandra Cjvinskija na čelo antikorupcijskog Ureda za ekonomsku sigurnost.

min čitanja

Više

Politika

Kijev pod pritiskom: parlament danas vraća ovlasti antikorupcijskim tijelima
Ukrajinski parlament glasa o povratku ovlasti antikorupcijskim tijelima nakon žestokih prosvjeda i upozorenja Europske unije.

min čitanja

Više

Aktualno

1

Vijesti

Izvađena „Kruna mora“ iz splitske luke, brodari skupili 63 tisuće eura pomoći

2

Lifestyle

Šajetina himna šalterima postala hit: „Idemo na mer” u pet dana do 100.000 pregleda

3

Vijesti

U Istri razotkriven dvojac pljačkaša: krali suhomesnate delicije i alkohol, jednog zatekli s kokainom

4

Lifestyle

„Taste Mediterranean” stiže na Kvarner: Mali Lošinj pretvara se u kulinarsku pozornicu

5

Vijesti

Rijeka nabavila novi kombi za prijevoz osoba s invaliditetom

6

Politika

Starijim Britancima prijeti 14 godina zatvora zbog potpore skupini Palestine Action

7

Politika

Macron hvali carinski sporazum s SAD-om, ali upozorava: „Prvi korak, ne kraj priče”

8

Politika

Načelnica Matulja prelazi s volonterskog na profesionalni mandat

9

Politika

Bruxelles pritišće Kijev zbog blokade imenovanja šefa Ureda za ekonomsku sigurnost

10

Politika

Kijev pod pritiskom: parlament danas vraća ovlasti antikorupcijskim tijelima

11

Vijesti

Delnički dom zdravlja kreće u energetsku transformaciju vrijednu više od dva milijuna eura