CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. kolovoza 2025, 06:24

Tencent i američko sveučilište predstavili R-Zero: sustav u kojem se veliki jezični modeli sami usavršavaju

R-Zero omogućuje velikim jezičnim modelima da se treniraju bez ljudskih oznaka, podiže im sposobnost zaključivanja i otvara nova vrata autonomnoj umjetnoj inteligenciji.

min. čitanja

XFacebookWhatsApp

Istraživači iz Tencent AI Laba i Sveučilišta Washington u St. Louisu predstavili su novi okvir nazvan R-Zero koji omogućuje velikim jezičnim modelima (LLM-ovima) da se treniraju bez ijednog ljudski označenog podatka.

Modeli kao vlastiti učitelji

• R-Zero započinje s jednim osnovnim modelom koji se dijeli na dvije uloge: – Challenger (izazivač) generira zadatke točno na granici trenutačnih mogućnosti modela. – Solver (rješavač) nastoji riješiti te sve teže zadatke i za to biva nagrađen.

• Nakon svake runde izazova Solverova rješenja idu na „glasovanje” – većinska odluka određuje točan odgovor, a najraznovrsnija pitanja ulaze u novu trening-datoteku. Ciklus se ponavlja, pri čemu oba modela ko-evoluiraju i postaju sve sposobniji bez ikakve ljudske intervencije.

Rezultati na otvorenim modelima

• Na modelu Qwen3-4B-Base prosječni rezultat na matematičkim testovima porastao je za 6,49 bodova, dok je veći Qwen3-8B-Base napredovao za 5,51 boda nakon tri iteracije.

• Već prva iteracija donijela je znatni skok, što, prema autorima, potvrđuje da „inteligentni kurikulum” koji stvara RL-učen Challenger djeluje bolje od slučajno generiranih zadataka.

• Stečene vještine s matematike prenijele su se i na opće domene: isti Qwen3-4B-Base ostvario je poboljšanje od 7,54 boda na skupovima MMLU-Pro i SuperGPQA.

• R-Zero se pokazao učinkovitom predpripremom; modeli koji su prošli ovaj proces kasnije su postizali dodatna poboljšanja kad su naknadno fino podešeni na klasičnim, ručno označenim podacima.

Zašto je to važno za industriju

Dok je prikupljanje i označavanje velikih korpusa podataka skupo i sporo, R-Zero preskače taj usko grlo. Chengsong Huang, suautor rada, ističe da je riječ o „putu prema stvaranju AI-a koji može nadmašiti ljudske sposobnosti jer više nije ograničen ljudskim znanjem ili podacima”.

Izazovi koji ostaju

• Točnost „samogeneriranih” odgovora pada kako zadaci postaju teži: s 79 % u prvoj na 63 % u trećoj iteraciji u usporedbi s referentnim GPT-4 modelom. Autori priznaju da je dugoročno održavanje napretka bez plateau-efekta „značajan istraživački izazov”.

• Okvir zasad najbolje radi u disciplinama s jasnim kriterijem točnosti, primjerice matematici. Za subjektnije zadatke istraživači razmatraju dodavanje trećeg agenta – Verifikatora – koji bi procjenjivao kvalitetu odgovora prema finijim kriterijima.

R-Zero tako otvara vrata autonomnim sustavima koji bi jednog dana mogli učiti i o objektivnim i o subjektivnim problemima – bez da itko ručno priprema podatke.

#sveuciliste-washington#tencent#saint-louis#chengsong-huang

Slično

Tehnologija

AI2 lansirao Olmo 3.1, dosad najmoćniji model s naglaskom na učinkovitost i kontrolu
Allen Institute for AI predstavio je Olmo 3.1, novu i snažniju generaciju jezičnih modela usmjerenih na učinkovitost, transparentnost i precizno praćenje uputa.

min čitanja

Više

Tehnologija

Google i UC Santa Barbara razvili "štedljive" tehnike za velike jezične agente
Nova studija pokazuje kako agentima velikih jezičnih modela dati „osjećaj za novčanik” i tako uštedjeti tokene, vrijeme i novac.

min čitanja

Više

Tehnologija

Prvi hrvatski baterijski vlak ulazi u redoviti promet između Splita i Kaštel Staroga
Vlak domaće tvrtke Končar – Električna vozila od 15. prosinca svakodnevno će prevoziti putnike na relaciji Split – Kaštel Stari, otvarajući novu eru baterijskih vlakova na hrvatskim prugama.

min čitanja

Više

Tehnologija

Zagrebački „Guru za kulturu” pokazuje put: Riječani zazivaju vlastitu jedinstvenu platformu
Zagrebačka aplikacija „Guru za kulturu” objedinjuje sve kulturne događaje na jednom mjestu, a riječki kulturnjaci sada traže sličnu platformu za svoj grad.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Neprofitna inicijativa Fulu plaća hakere da ožive „mrtve” uređaje
Fulu nudi novčane nagrade za hakere koji oslobode potrošače ograničenja i produže vijek trajanja uređaja koje su proizvođači već otpisali.

min čitanja

Više

Tehnologija

Kadmij-cinkov telurid skratio bolničke CT preglede na 15 minuta
Brži pregledi, manje zračenja i jasnije slike: londonska bolnica uvela skener s kristalima kadmij-cinkovog telurida.

min čitanja

Više

Tehnologija

Cohere predstavio Rerank 4 s četiri puta većim kontekstom
Rerank 4 donosi kontekst od 32 000 tokena, više varijanti i naglasak na brže, preciznije pretrage.

min čitanja

Više

Tehnologija

Krapinski IT-jevac pretvara klikove u noćenja: softver Ivana Petrovića diže prihode malim hotelima
Ivan Petrović iz Krapinskih Toplica razvio je softver koji malim hotelima u regiji diže prihode i smanjuje ovisnost o posrednicima.

min čitanja

Više

Tehnologija

Autorica priznala golemu pogrešku u bestseleru o umjetnoj inteligenciji
Karen Hao na X-u priznala da je u knjizi „Empire of AI” pogrešno procijenila potrošnju vode Googleova podatkovnog centra – i to za faktor 1.000.

min čitanja

Više

Tehnologija

Gotovo 9,1 milijun eura za transformaciju istraživačkog centra METRIS u Puli
Istarsko veleučilište osiguralo je 9,1 milijun eura iz europskog Fonda za pravednu tranziciju za proširenje prostora, nabavu opreme i razvoj novih programa u istraživačkom centru METRIS.

min čitanja

Više

Najčitanije

Nogomet

Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556

Policija pojačava osiguranje derbija Lokomotiva – Hajduk
MUP je dvoboj Lokomotive i Hajduka na Maksimiru proglasio utakmicom visokog rizika i najavio pojačane sigurnosne mjere.

min čitanja

Više

Biznis

Vedriš: devizni depoziti guraju cijene stanova, pad tržišta nije na vidiku
Ekonomist Mladen Vedriš uvjeren je da će 40 milijardi eura štednje i ulaganja u željeznicu održati građevinski sektor te spriječiti pad cijena nekretnina i nakon 2026.

min čitanja

Više

Politika

Plan specijalizacija: obiteljska medicina dobiva 600 mjesta, liječnici sumnjičavi
Novo usvojeni nacionalni plan otvara rekordnih 600 specijalizacija za obiteljsku medicinu, no liječničke organizacije sumnjaju da će to biti dovoljno bez boljih radnih uvjeta.

min čitanja

Više

Vijesti

Noćna drama u Gubaševu: požar u pogonu CIAK-a pod kontrolom, građanima preporučeno zatvaranje prozora
Veliki požar zahvatio je pogon za recikliranje akumulatora u Gubaševu kraj Zaboka; vatrogasci su ga lokalizirali, ali stanovnici se pozivaju na oprez dok se čeka analiza zraka.

min čitanja

Više

Najnovije

Sport

U Puli otvoren međunarodni kickboxing turnir s 652 borca

Politika

Performans u Puli: Radnička fronta Istre i Kvarnera digla glas protiv femicida

Lifestyle

Vuk Ognjenović obilježava 30 godina karijere baletnom čarolijom „Orašara”

Biznis

Obrtnička komora PGŽ-a nagradila najzaslužnije: Robert Stanić dobitnik Nagrade za životno djelo

Politika

Šuta najavio selidbu gradske uprave u Loru, sudbina Banovine i dalje izaziva prijepore

Lifestyle

Maja Šuput i Šime Elez nastavljaju zajedničke nastupe: romansa ili dobro osmišljena promocija?

Sport

Englezi već otpisuju Hrvatsku: „Modrić ima 40 godina, to sve govori”

Vijesti

Šok u Hollywoodu: preminuo Peter Greene, karizmatični negativac Tarantina

Vijesti

Zabrinutost zbog otmice u Nigeriji: više od 300 učenika odvedeno, u regiji živi i dvadesetak Hrvata

Lifestyle

Ogrebotina na nosu Bradleyja Coopera zasjenila premijeru filma „Is This Thing On?”

Politika

Ministri EU-a odbili drastične rezove ribolova u Sredozemlju