CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

8. siječnja 2026, 06:05

Novi indeks inteligencije mijenja pravila: umjetna inteligencija odsad se ocjenjuje kroz stvarni rad

Artificial Analysis objavio je Indeks inteligencije v4.0, drastično promijenio testove i preusmjerio fokus s trivijalnih kvizova na zadatke koji generiraju ekonomsku vrijednost.

min. čitanja

XFacebookWhatsApp

Umjetna inteligencija više se ne mjeri po tome koliko točno pogodi kviz-pitanje, nego koliko dobro obavlja posao za koji bi tvrtke platile stvarnu plaću. Takav zaokret donosi Artificial Analysis, neovisna benchmarking organizacija koja je objavila četvrtu verziju svojeg Indeksa inteligencije (v4.0).

Vraćanje „margine za rast” Prethodni testovi toliko su se zasitili da su vodeći modeli rutinski osvajali 90. percentil, čineći rejtinge beskorisnima za poslovne kupce. U novoj ljestvici najbolji modeli jedva prelaze 50 bodova, dok su ranije imali prosjek 73. „Ova promjena odražava širu tranziciju: inteligencija se mjeri manje po pamćenju, a više po ekonomski korisnoj akciji”, napisao je istraživač Aravind Sundar na X-u.

Četiri stupa sposobnosti Indeks sada jednako vrednuje agente, kodiranje, znanstveno zaključivanje i opće znanje. Ključne su tri nove evaluacije:

  1. GDPval-AA – procjenjuje može li AI isporučiti dokumente, tablice, prezentacije i multimediju za 44 zanimanja u devet industrija. Modeli dobivaju pristup ljusci sustava i pregledniku, a rezultati se mjere Elo sustavom u slijepim usporedbama. GPT-5.2 s produženim razmišljanjem vodi s 1 442 boda; Claude Opus 4.5 slijedi sa 1 403.

  2. CritPT – 71 istraživački zadatak iz suvremene fizike, kreiran od 50 znanstvenika. GPT-5.2 jedva osvaja 11,5 %, što pokazuje koliko su modeli još daleko od pravog znanstvenog otkrića.

  3. AA-Omniscience – 6 000 pitanja iz gospodarstva, zdravstva, prava, softvera i drugih područja mjere točnost, ali i sklonost halucinacijama. Gemini 3 Pro Preview ima najbolji Omniscience indeks (13), no pokazuje i visoku stopu halucinacija (88 %).

Top lista modela (ukupni Indeks v4.0) • GPT-5.2 (OpenAI) – 1. mjesto
• Claude Opus 4.5 (Anthropic) – 2. mjesto
• Gemini 3 Pro (Google) – 3. mjesto

Industrija u „code redu” Googleovo lansiranje Geminija 3 potaknulo je OpenAI na interni „code red”. „Željeli smo usmjeriti sve resurse na jedno područje”, rekla je Fidji Simo, direktorica aplikacija u OpenAI-ju. U međuvremenu je Anthropic izbacio tri velika modela u dva mjeseca i uz potporu Microsofta i Nvidije dosegnuo vrijednost od oko 350 milijardi dolara.

Za poslovne korisnike poruka je jasna: prije odabira modela treba proučiti pojedinačne bodove, osobito kad je riječ o halucinacijama, jer „visoka točnost ne jamči nisku sklonost izmišljanju”. Artificial Analysis tvrdi da su svi testovi neovisni, s 95-postotnim intervalom pouzdanosti manjim od ±1 %.

Nova metodologija konačno prati ono što AI industrija obećava – stvarnu produktivnost, a ne puko rješavanje zagonetki.

#nvidia#google#openai#anthropic#artificial-analysis
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Kako ukloniti Gemini Nano iz Chromea i što time gubite
Googleov AI model Gemini Nano potajno zauzima 4 GB na računalima korisnika Chromea. Donosimo upute kako ga isključiti i koje sigurnosne značajke tada prestaju raditi.

min čitanja

Više

Tehnologija

Čudni verbalni tikovi ChatGPT-a sve više iritiraju kineske korisnike
Kineski korisnici sve češće kritiziraju ChatGPT zbog neprirodnih fraza koje se uporno ponavljaju u njegovim odgovorima.

min čitanja

Više

Tehnologija

Fitbit postaje Google Health, a Google Fit odlazi u povijest
Google je potvrdio da će popularna aplikacija Fitbit uskoro postati Google Health, dok će Google Fit biti ugašen do kraja godine.

min čitanja

Više

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja
Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”
Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej
Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku
Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja
Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana
KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Vijesti

Rovinj obilježio Dan pobjede nad nacifašizmom i Dan Europe
Grad na Valdibori polaganjem vijenca i prigodnim programom podsjetio na važnost slobode, mira i zajedništva.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Mali olimpijci preplavili Zelinu i pokazali sportski duh

Vijesti

Vinkovci na sajmu EU projekata pokazali kako fondovi mijenjaju lice grada

Politika

Sokol uzvraća Plenkoviću: „Unutarstranački nesporazumi trebaju ostati unutra, ali HDZ mora biti snažan”

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja

Sport

Vekić s ekspresnom pobjedom u polufinalu Istanbula

Biznis

Državne nekretnine otvaraju vrata poslovnim prostorima u sedam gradova

Lifestyle

Hrvatske majke sve starije i obrazovanije, a djece sve manje

Sport

Ulaznice za derbi Dinamo – Hajduk gotovo planule, Maksimir sprema vatrenu atmosferu

Vijesti

Sindikat biciklista: pet godina obećanja, a zagrebačke ulice i dalje neprijateljske za bicikle

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”

Vijesti

„Knjiga od srca“ u Senju osigurala pakete pomoći najsiromašnijima