CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. kolovoza 2025, 06:24

Tencent i američko sveučilište predstavili R-Zero: sustav u kojem se veliki jezični modeli sami usavršavaju

R-Zero omogućuje velikim jezičnim modelima da se treniraju bez ljudskih oznaka, podiže im sposobnost zaključivanja i otvara nova vrata autonomnoj umjetnoj inteligenciji.

min. čitanja

XFacebookWhatsApp

Istraživači iz Tencent AI Laba i Sveučilišta Washington u St. Louisu predstavili su novi okvir nazvan R-Zero koji omogućuje velikim jezičnim modelima (LLM-ovima) da se treniraju bez ijednog ljudski označenog podatka.

Modeli kao vlastiti učitelji

• R-Zero započinje s jednim osnovnim modelom koji se dijeli na dvije uloge: – Challenger (izazivač) generira zadatke točno na granici trenutačnih mogućnosti modela. – Solver (rješavač) nastoji riješiti te sve teže zadatke i za to biva nagrađen.

• Nakon svake runde izazova Solverova rješenja idu na „glasovanje” – većinska odluka određuje točan odgovor, a najraznovrsnija pitanja ulaze u novu trening-datoteku. Ciklus se ponavlja, pri čemu oba modela ko-evoluiraju i postaju sve sposobniji bez ikakve ljudske intervencije.

Rezultati na otvorenim modelima

• Na modelu Qwen3-4B-Base prosječni rezultat na matematičkim testovima porastao je za 6,49 bodova, dok je veći Qwen3-8B-Base napredovao za 5,51 boda nakon tri iteracije.

• Već prva iteracija donijela je znatni skok, što, prema autorima, potvrđuje da „inteligentni kurikulum” koji stvara RL-učen Challenger djeluje bolje od slučajno generiranih zadataka.

• Stečene vještine s matematike prenijele su se i na opće domene: isti Qwen3-4B-Base ostvario je poboljšanje od 7,54 boda na skupovima MMLU-Pro i SuperGPQA.

• R-Zero se pokazao učinkovitom predpripremom; modeli koji su prošli ovaj proces kasnije su postizali dodatna poboljšanja kad su naknadno fino podešeni na klasičnim, ručno označenim podacima.

Zašto je to važno za industriju

Dok je prikupljanje i označavanje velikih korpusa podataka skupo i sporo, R-Zero preskače taj usko grlo. Chengsong Huang, suautor rada, ističe da je riječ o „putu prema stvaranju AI-a koji može nadmašiti ljudske sposobnosti jer više nije ograničen ljudskim znanjem ili podacima”.

Izazovi koji ostaju

• Točnost „samogeneriranih” odgovora pada kako zadaci postaju teži: s 79 % u prvoj na 63 % u trećoj iteraciji u usporedbi s referentnim GPT-4 modelom. Autori priznaju da je dugoročno održavanje napretka bez plateau-efekta „značajan istraživački izazov”.

• Okvir zasad najbolje radi u disciplinama s jasnim kriterijem točnosti, primjerice matematici. Za subjektnije zadatke istraživači razmatraju dodavanje trećeg agenta – Verifikatora – koji bi procjenjivao kvalitetu odgovora prema finijim kriterijima.

R-Zero tako otvara vrata autonomnim sustavima koji bi jednog dana mogli učiti i o objektivnim i o subjektivnim problemima – bez da itko ručno priprema podatke.

#sveuciliste-washington#tencent#saint-louis#chengsong-huang

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Novi korak u razvoju AI agenata: „harness engineering” otvara vrata autonomnim pomoćnicima
Veliki jezični modeli sve su bliže tome da postanu dugotrajni, autonomni asistenti zahvaljujući konceptu „harness engineeringa”, tvrdi šef LangChaina Harrison Chase.

min čitanja

Više

Tehnologija

Volvo EX30 osvježen za Europu: novi početni motor, Black Edition i belgijska proizvodnja
Najmanji električni model marke dobio je slabiji, pristupačniji motor, V2L funkciju te posebni Black Edition, a za europsko se tržište odsad sklapa u Belgiji.

min čitanja

Više

Tehnologija

Osvježena Cupra Born stiže brže, snažnije i skuplje
Facelift Cupre Born donosi snažnije brzo punjenje, veći infotainment i raspon cijena od 31 700 do 52 000 eura.

min čitanja

Više

Tehnologija

Splitu potreban vlastiti ciklotron, a ne novi ugovor s Medikolom
Znanstvenici tvrde da bi lokalna proizvodnja radiofarmaka u KBC-u Split uštedjela milijune, ubrzala dijagnostiku i smanjila ovisnost o privatnim partnerima.

min čitanja

Više

Tehnologija

Google uvodi kontakte za oporavak: do 10 pouzdanih osoba mogu vas vratiti u zaključani račun
Nova opcija Recovery Contacts omogućuje korisnicima da zatraže pomoć do deset prijatelja ili članova obitelji za brži povrat pristupa zaključanom Google računu.

min čitanja

Više

Tehnologija

Startup Deveillance najavio prijenosni „Spectre I” koji ultrazvukom blokira prisluškivanje
Orbita nalik uređaj od 1 199 dolara kombinira ultrazvuk i umjetnu inteligenciju kako bi onemogućio snimanje glasa i detektirao skrivene mikrofone, a na tržište stiže u drugoj polovici 2026.

min čitanja

Više

Tehnologija

Obnovljena rasprava o fandomu: zašto je „Heated Rivalry” ponovno okupio Tumblr, a Twitter učinio otrovnijim
Queer hokejaška drama „Heated Rivalry” ponovno je oživjela Tumblr, ali je na X-u potaknula val toksičnih prepirki, otkrivajući generacijski i platformni jaz unutar online fandoma.

min čitanja

Više

Tehnologija

MIT predstavio Attention Matching: nova tehnika koja 50 puta smanjuje memorijski teret velikih jezičnih modela
Nova metoda MIT-ovih istraživača pokazuje kako se radna memorija velikih jezičnih modela može smanjiti i do 50 puta, a da se pritom ne gubi kvaliteta odgovora.

min čitanja

Više

Tehnologija

Od brojčanika do širokopojasne mreže: pulski vremeplov tehnološkog skoka
Nostalgija za vremenom kada su Pulu osvajala prva računala, videokasete i telefonske govornice.

min čitanja

Više

Tehnologija

Od srpnja obvezan signal za nužno zaustavljanje u svim novim autima
Europska unija od 7. srpnja uvodi obvezu ugradnje signala za nužno zaustavljanje u sve nove automobile, bez kojeg registracija više neće biti moguća.

min čitanja

Više

Najčitanije

Nogomet

Baturinin peti ligaški pogodak gurnuo Como do četvrtog mjesta
Hrvatski veznjak donio je vodstvo u Cagliariju i pogurao Como do bodovnog poravnanja s Romom.
By PIXSELL, CC BY 3.0, https://commons.wikimedia.org/w/index.php?curid=148385547

min čitanja

Više

Nogomet

Sabra ispisao povijest, Vuk donio Varaždinu bod u Maksimiru
Lokomotiva i Varaždin remizirali 1-1 u Maksimiru uz povijesni gol Jordanca Sabre i dvostruku VAR intervenciju.

min čitanja

Više

Vijesti

Tragedija na Krku: u opožarenoj kući pronađeno tijelo 74-godišnjaka
Vatrogasci su u opožarenoj kući u gradu Krku pronašli tijelo muškarca; policija istražuje okolnosti tragedije.

min čitanja

Više

Nogomet

Vušković iznudio i realizirao jedanaesterac za HSV-ov bod u Wolfsburgu
Hrvatski 17-godišnjak prvo je izborio jedanaesterac, a zatim ga i sam pretvorio u peti gol sezone, donijevši HSV-u remi protiv Wolfsburga.

min čitanja

Više

Nogomet

Budimirov gol u sudačkoj nadoknadi spasio Osasunu od poraza
Hrvatski reprezentativac u 94. minuti donio bod Osasuni i dodatno zakomplicirao borbu Mallorce za ostanak u La Ligi.
By PIXSELL, CC BY 3.0, https://commons.wikimedia.org/w/index.php?curid=125826996

min čitanja

Više

Najnovije

Sport

Borussia Dortmund iskoristila igrača više i odnijela pobjedu u Kölnu

Politika

Američki ICE protjerao majku i dvoje djece: gluhoj šestogodišnjakinji ostala pomagala u San Franciscu

Vijesti

Pas izletio na ulicu i ozlijedio poštara u Slavonskom Brodu

Politika

Gvozdanović upozorava na prešućeni paradoks oko Hormuškog tjesnaca

Sport

Jakirovićev Hull ponovno posrnuo: Millwall slavio 3:1 na MKM-u

Tehnologija

Novi korak u razvoju AI agenata: „harness engineering” otvara vrata autonomnim pomoćnicima

Vijesti

Senjski osnovci uronili u svijet velebitskih ptica

Vijesti

Iftar u riječkom Islamskom centru okupio vjernike i političare u znaku dijaloga

Politika

Stručnjaci upozoravaju: Nuklearna arhitektura puca pod pritiskom, ali nada i dalje postoji

Sport

Francuz Gorice promašio prazna vrata i ušao u HNL-ov antologijski popis

Sport

Gorica i Slaven Belupo remizirali u golijadi u Velikoj Gorici