CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

14. lipnja 2025, 08:26

Apple izazvao buru: jesu li LLM-ovi doista sposobni zaključivati?

Appleov istraživački rad o (ne)sposobnosti LLM-ova za zaključivanje izazvao je val kritika i suprotni studij koji tvrdi da su padovi performansi zapravo rezultat loše postavljenih testova, a ne manjka „inteligencije” modela.

min. čitanja

XFacebookWhatsApp

Appleova istraživačka skupina za strojno učenje objavila je rad „The Illusion of Thinking” i potaknula žestoku raspravu u zajednici umjetne inteligencije. U 53 stranice autori tvrde da modeli za tzv. veliko rezoniranje – poput OpenAI-jeva „o” niza ili Googleova Gemini-2.5 Pro – ne „razmišljaju” nego naprosto prepoznaju obrasce te posustaju čim se zadaci zakompliciraju.

Kako je izgledalo Appleovo testiranje

• Istraživači su modele suočili s klasikom kognitivnih i AI-puzzli: Tower of Hanoi, Blocks World, River Crossing i Checkers Jumping. • Svaka je zagonetka zahtijevala višekorakno planiranje i objašnjenje logike putem chain-of-thought upita. • Što su zadaci postajali složeniji, to je točnost padala; na najtežoj razini modeli su pali na nulu. • Istodobno su se skraćivali „tragovi razmišljanja” (broj tokena), što je Apple protumačio kao odustajanje od rješavanja.

Kritike: problem je u tokenima, ne u logici

Na X-u (bivšem Twitteru) brojni su stručnjaci osporili metodologiju.

• @scaling01 ukazao je da Tower of Hanoi eksponencijalno povećava veličinu izlaza: „S više od 13 diskova svi modeli imaju 0 % jer fizički ne mogu ispisati toliko!” • Kritičari su primijetili da Apple nije usporedio rezultate s ljudskim sudionicima, pa nije jasno gube li i ljudi preciznost bez bilješki. • Neki su sugerirali da tvrtka, zaostala za OpenAI-jem i Googleom, možda nastoji spustiti ljestvicu očekivanja.

Rebuttal: „The Illusion of the Illusion of Thinking”

Neovisni istraživač Alex Lawsen i model Claude Opus 4 objavili su odgovor tvrdeći da su „kolapsi” rezultat loše postavljenog testa.

• Appleov skript označavao je rješenja netočnima čim bi modeli premašili ograničenje tokena, iako je strategija bila točna. • Kad su smjeli dati sažet, programerski odgovor – primjerice Lua funkciju koja generira korake Tower of Hanoija – modeli su uspješno riješili daleko složenije verzije problema.

Zašto je važno za poduzeća

Rasprava otkriva da je dizajn evaluacije jednako presudan kao i arhitektura modela.

  1. Dugi lančani zadaci mogu se „slomiti” ne zbog manjka logike, nego zbog premale radne memorije ili prevelikog zahtjeva za eksplicitnim ispisom.
  2. Poduzeća koja grade agente ili kopilote trebaju razmotriti vanjsko spremište memorije, podjelu zadataka u manje cjeline ili komprimirane izlaze (kod umjesto teksta).
  3. Sintetički benchmark ne smije biti jedino mjerilo; realni slučajevi uporabe često traže drugačiji oblik odgovora.

Zaključak

Umjesto definitivnog presuđivanja o „kraju” rezoniranja u LLM-ovima, aktualna polemika naglašava koliko su format pitanja, ograničenja tokena i kriteriji ocjenjivanja ključni za procjenu stvarnih sposobnosti modela. Prije nego što se proglasi proboj – ili fijasko – potrebno je provjeriti je li problem možda u kutiji u koju smo model smjestili, a ne u samom modelu.

#google#apple#openai#claude-opus-4#alex-lawsen
View post on X
View post on X
View post on X
View post on X
View post on X
View post on X

Slično

Tehnologija

Google i NextEra oživljavaju nuklearku u Iowi za pogon podatkovnih centara
Napuštena nuklearna elektrana Duane Arnold predviđena je za ponovno pokretanje 2029. zahvaljujući partnerstvu između Googlea i NextEra Energyja, koje bi trebalo osigurati 600 MW stalne struje za rastuću mrežu podatkovnih centara u Iowi.

min čitanja

Više

Tehnologija

Google i UC Santa Barbara razvili "štedljive" tehnike za velike jezične agente
Nova studija pokazuje kako agentima velikih jezičnih modela dati „osjećaj za novčanik” i tako uštedjeti tokene, vrijeme i novac.

min čitanja

Više

Tehnologija

Neprofitna inicijativa Fulu plaća hakere da ožive „mrtve” uređaje
Fulu nudi novčane nagrade za hakere koji oslobode potrošače ograničenja i produže vijek trajanja uređaja koje su proizvođači već otpisali.

min čitanja

Više

Tehnologija

Autorica priznala golemu pogrešku u bestseleru o umjetnoj inteligenciji
Karen Hao na X-u priznala da je u knjizi „Empire of AI” pogrešno procijenila potrošnju vode Googleova podatkovnog centra – i to za faktor 1.000.

min čitanja

Više

Tehnologija

Disney ulaže milijardu dolara u OpenAI i otvara svoje likove umjetnoj inteligenciji
Tek nakon niza tužbi Disney se okreće novoj strategiji: licencira likove OpenAI-ju, ulaže milijardu dolara i priprema se za eru AI videa na Disney+-u.

min čitanja

Više

Tehnologija

Orqin hackathon na EFOS-u: studenti rješavali izazove, a tvrtka lovi nove talente
Na EFOS-u je održan Orqin hackathon na kojem su studenti radili na strategiji za usklađivanje triju Orqinih tržišta – vojnog, potrošačke elektronike i obrazovnog – dok brzo rastuća osječka tvrtka traži svježe ideje i nove zaposlenike.

min čitanja

Više

Tehnologija

Del Toro upozorava: „Algoritam ne smije istisnuti ljudsku maštu“
Guillermo del Toro kritizira bezrezervno korištenje umjetne inteligencije u filmu i otkriva detalje o svom novom, za Zlatni globus nominiranom, „Frankensteinu“.

min čitanja

Više

Tehnologija

AI2 lansirao Olmo 3.1, dosad najmoćniji model s naglaskom na učinkovitost i kontrolu
Allen Institute for AI predstavio je Olmo 3.1, novu i snažniju generaciju jezičnih modela usmjerenih na učinkovitost, transparentnost i precizno praćenje uputa.

min čitanja

Više

Tehnologija

Prvi hrvatski baterijski vlak ulazi u redoviti promet između Splita i Kaštel Staroga
Vlak domaće tvrtke Končar – Električna vozila od 15. prosinca svakodnevno će prevoziti putnike na relaciji Split – Kaštel Stari, otvarajući novu eru baterijskih vlakova na hrvatskim prugama.

min čitanja

Više

Tehnologija

Zagrebački „Guru za kulturu” pokazuje put: Riječani zazivaju vlastitu jedinstvenu platformu
Zagrebačka aplikacija „Guru za kulturu” objedinjuje sve kulturne događaje na jednom mjestu, a riječki kulturnjaci sada traže sličnu platformu za svoj grad.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Najčitanije

Politika

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234
Babiš odbija češka jamstva za novi zajam Ukrajini
Novi premijer Andrej Babiš najavio da Češka neće jamčiti za planirani europski kredit Ukrajini, pozvavši Bruxelles da pronađe druge načine potpore.

min čitanja

Više

Vijesti

Pokušaj ubojstva u Velikoj Gorici: 26-godišnjak oštrim predmetom napao 21-godišnjakinju
Mladić (26) u Velikoj Gorici pokušao usmrtiti 21-godišnjakinju oštrim predmetom; žrtva zadobila lakše ozljede, napadač uhićen.

min čitanja

Više

Politika

Plenković mladima poručio: „Izvolite se ukopčati” i preuzmite odgovornost
Novi predsjednik Tin Jurak najavio je ofenzivu na ključna pitanja mladih, a premijer Plenković pozvao ih je da se uključe u borbu protiv nasilja, ovisnosti i društvenih anomalija.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986European People's Party, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Politika

Hajdaš Dončić: „Premijer pleše tango s balkanskim mirisom, SDP će stati na crtu radikalizmu”
Predsjednik SDP-a na sjednici Glavnog odbora optužio Plenkovića da popušta radikalizmu i najavio siječanjsku konvenciju s ekonomskim i društvenim reformama.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986Autor Social Democratic Party of Croatia - https://flickr.com/photos/59485410@N07/29007717956, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=153450927

min čitanja

Više

Vijesti

Šok u Hollywoodu: preminuo Peter Greene, karizmatični negativac Tarantina
Glumac koji je ostavio neizbrisiv trag u „Paklenom šundu” i „Maski” pronađen je mrtav u 60. godini života.

min čitanja

Više

Najnovije

Politika

Otkriveni detalji Trumpove strategije: SAD želi bliže odnose s desnim vladama u Europi

Lifestyle

Svećenik Horvat viralno o zavisti i hrabrosti: „Sami biramo kakvi ćemo biti”

Vijesti

Hrvat na Redditu srušio idealiziranu sliku Njemačke

Sport

Splitska taekwondo senzacija: Magdalena Matić gradi put prema olimpijskim snovima

Politika

Lukašenko pustio 123 politička zatvorenika, Washington ukinuo sankcije na bjelorusku potašu

Sport

Puljani najavljuju bitku u Zagrebu protiv moćnog Dinama

Sport

Četiri hrvatska slalomaša spremna za Val d’Isere

Politika

Babiš odbija češka jamstva za novi zajam Ukrajini

Vijesti

Bilaj se poklonio riječkim herojima Domovinskog rata

Lifestyle

Khloé Kardashian javno koketirala s privlačnim srednjoškolskim profesorom

Politika

Bangkok odbija poziv na prekid vatre s Phnom Penhom