CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. kolovoza 2025, 06:24

Tencent i američko sveučilište predstavili R-Zero: sustav u kojem se veliki jezični modeli sami usavršavaju

R-Zero omogućuje velikim jezičnim modelima da se treniraju bez ljudskih oznaka, podiže im sposobnost zaključivanja i otvara nova vrata autonomnoj umjetnoj inteligenciji.

min. čitanja

XFacebookWhatsApp

Istraživači iz Tencent AI Laba i Sveučilišta Washington u St. Louisu predstavili su novi okvir nazvan R-Zero koji omogućuje velikim jezičnim modelima (LLM-ovima) da se treniraju bez ijednog ljudski označenog podatka.

Modeli kao vlastiti učitelji

• R-Zero započinje s jednim osnovnim modelom koji se dijeli na dvije uloge: – Challenger (izazivač) generira zadatke točno na granici trenutačnih mogućnosti modela. – Solver (rješavač) nastoji riješiti te sve teže zadatke i za to biva nagrađen.

• Nakon svake runde izazova Solverova rješenja idu na „glasovanje” – većinska odluka određuje točan odgovor, a najraznovrsnija pitanja ulaze u novu trening-datoteku. Ciklus se ponavlja, pri čemu oba modela ko-evoluiraju i postaju sve sposobniji bez ikakve ljudske intervencije.

Rezultati na otvorenim modelima

• Na modelu Qwen3-4B-Base prosječni rezultat na matematičkim testovima porastao je za 6,49 bodova, dok je veći Qwen3-8B-Base napredovao za 5,51 boda nakon tri iteracije.

• Već prva iteracija donijela je znatni skok, što, prema autorima, potvrđuje da „inteligentni kurikulum” koji stvara RL-učen Challenger djeluje bolje od slučajno generiranih zadataka.

• Stečene vještine s matematike prenijele su se i na opće domene: isti Qwen3-4B-Base ostvario je poboljšanje od 7,54 boda na skupovima MMLU-Pro i SuperGPQA.

• R-Zero se pokazao učinkovitom predpripremom; modeli koji su prošli ovaj proces kasnije su postizali dodatna poboljšanja kad su naknadno fino podešeni na klasičnim, ručno označenim podacima.

Zašto je to važno za industriju

Dok je prikupljanje i označavanje velikih korpusa podataka skupo i sporo, R-Zero preskače taj usko grlo. Chengsong Huang, suautor rada, ističe da je riječ o „putu prema stvaranju AI-a koji može nadmašiti ljudske sposobnosti jer više nije ograničen ljudskim znanjem ili podacima”.

Izazovi koji ostaju

• Točnost „samogeneriranih” odgovora pada kako zadaci postaju teži: s 79 % u prvoj na 63 % u trećoj iteraciji u usporedbi s referentnim GPT-4 modelom. Autori priznaju da je dugoročno održavanje napretka bez plateau-efekta „značajan istraživački izazov”.

• Okvir zasad najbolje radi u disciplinama s jasnim kriterijem točnosti, primjerice matematici. Za subjektnije zadatke istraživači razmatraju dodavanje trećeg agenta – Verifikatora – koji bi procjenjivao kvalitetu odgovora prema finijim kriterijima.

R-Zero tako otvara vrata autonomnim sustavima koji bi jednog dana mogli učiti i o objektivnim i o subjektivnim problemima – bez da itko ručno priprema podatke.

#sveuciliste-washington#tencent#saint-louis#chengsong-huang

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

S lažnim linkom starijem Osječaninu ukraden 1.500 eura
Osječka policija istražuje internetsku prijevaru u kojoj je 70-godišnjak, želeći ulagati u kriptovalute, putem lažnog linka ostao bez 1.500 eura.

min čitanja

Više

Tehnologija

Pametni satovi četiri puta češće otkrivaju fibrilaciju atrija od klasičnih pregleda
Studija iz Amsterdama pokazala je da nosivi EKG uređaji četiri puta češće otkrivaju fibrilaciju atrija od klasičnih pregleda, što bi moglo smanjiti rizik od moždanog udara.

min čitanja

Više

Tehnologija

Znanost zavladala Dioklecijanovim podrumima
U Dioklecijanovim podrumima otvorena je izložba „Science Comes to Town” s robotima, maslinovim uljem, Teslinim eksponatima i morskim čudima, a kulminirat će subotnjim spektaklom jedrilica i bibliobusa.

min čitanja

Više

Tehnologija

Apple optužuje Europsku komisiju za kočenje izmjena App Storea
Apple tvrdi da Bruxelles namjerno odgađa promjene nužne za usklađivanje s Aktom o digitalnim tržištima, dok Komisija uzvraća da rješenje mora omogućiti stvarnu konkurenciju.

min čitanja

Više

Tehnologija

Autori i izdavači ljuti: AI tvrtke i dalje skrivaju podatke o obuci modela
Kreativni sektor optužuje AI tvrtke da krše obvezu objave podataka o obuci modela i traži bržu reakciju Europske komisije.

min čitanja

Više

Tehnologija

Reuters Institute upozorava: AI sažeci prijete slabljenju novinskih brendova
Novo izvješće Reuters Institutea upozorava da bi generativni AI i „answer engine” sustavi mogli prepoloviti posjete portalima, narušiti povjerenje i zamagliti odgovornost za objavljene vijesti.

min čitanja

Više

Tehnologija

Velika obećanja o „godini AI agenata“ svela se na priču bez isporuke
Tehnološki divovi najavljivali su 2025. kao prekretnicu u kojoj će generativni AI agenti preuzeti svakodnevne zadatke, no ispostavilo se da je riječ tek o novom krugu prezentacija i odgoda.

min čitanja

Više

Tehnologija

Musk u Davosu predviđa kraj starenja: „Riješit ćemo to prije nego što mnogi misle”
Na Svjetskom ekonomskom forumu Elon Musk je ustvrdio da će ljudi uskoro moći preokrenuti starenje, ali je upozorio na društvene rizike „vječnog života”.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

AI oživio legendarne fotografije Feđe Klarića iz Splita osamdesetih
Legendarne crno-bijele kadrove splitskog fotografa pretvoreni su u kratke filmove koji vraćaju duh Splita osamdesetih.

min čitanja

Više

Tehnologija

Otkrivena baza s 149 milijuna ukradenih lozinki uklonjena nakon dojave istraživača
Baza s 149 milijuna ukradenih korisničkih računa – od Gmaila do Binancea – bila je javno dostupna sve dok je istraživač Jeremiah Fowler nije prijavio hosting kompaniji, koja ju je potom uklonila.

min čitanja

Više

Najčitanije

Vijesti

Pad ventilacije u splitskom neboderu usmrtio 49-godišnjeg radnika
Radnik je smrtno stradao kada je ventilacijska instalacija pala na njega u podrumu Koteksova nebodera; policija i državno odvjetništvo provode očevid.

min čitanja

Više

Politika

Ustavni sud BiH poništio Dodikovu vladu, upitna i nova postava u Banjoj Luci
Najviša sudska instanca BiH proglasila je neustavnom vladu formiranu na prijedlog Milorada Dodika, dok se ustavnost aktualnog sastava Sava Minića već osporava pred entitetskim sudom.
© European Union, 2025, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Politika

Hrstić: Ne očekujem masovni odljev osiguranika nakon poskupljenja dopunskog osiguranja
Cijena dopunskog osiguranja HZZO-a od 1. veljače raste na 15 eura, no ministrica zdravstva uvjerena je da to neće potaknuti prelazak na privatne police te podsjeća na zaštitu za socijalno ugrožene.

min čitanja

Više

Politika

Picula demantira Beograd: eurozastupnici razgledali izložbu o Jasenovcu usprkos tvrđenjima Brnabić
EP delegacija odbila je tvrdnje da je željela zaobići izložbu o Jasenovcu, dok Beograd ustraje na drugačijoj priči.
Sergei Bobylev, RIA Novosti, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia CommonsAutor Houses of the Oireachtas - https://www.flickr.com/photos/54097310@N08/52834888795/, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=132665020

min čitanja

Više

Vijesti

Više od 100 000 ljudi napustilo državljanstvo BiH od Daytona do danas
Službeni podaci otkrivaju kako je od Daytona do kraja 2025. čak 102 308 građana Bosne i Hercegovine zatražilo otpust iz državljanstva, uglavnom zbog stjecanja njemačkog ili austrijskog pasoša.

min čitanja

Više

Najnovije

Vijesti

Hauser predstavio tim: pet novih prorektora kreće s radom početkom veljače

Vijesti

Tinejdžeri pretukli mladića kod Zadra zbog duga, završio s teškim ozljedama

Tehnologija

S lažnim linkom starijem Osječaninu ukraden 1.500 eura

Vijesti

Rekordan odaziv na javnozdravstvenu akciju u Zagvozdu

Biznis

Dubrovačka tvornica duhana: zaboravljena pionirka industrije

Tehnologija

Pametni satovi četiri puta češće otkrivaju fibrilaciju atrija od klasičnih pregleda

Biznis

Veliko otkriće zlata i srebra na istoku BiH potvrdilo potencijal novog rudarskog diva

Vijesti

Dan Gimnazije Andrije Mohorovičića u znaku lokalnog identiteta i čakavštine

Lifestyle

Tri namirnice koje stručnjaci za sigurnost hrane zaobilaze u širokom luku

Vijesti

Templarska crkva svetog Martina kraj Našica čuva 800 godina tajni

Politika

Ustavni sud BiH naređuje hitnu istragu za raketiranje Ljubuškog 1992.