CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

1. rujna 2025, 11:22

R-Zero obećava samostalno učenje velikih jezičnih modela bez ljudskih oznaka

Tencent i Sveučilište Washington razvili su R-Zero, okvir koji omogućuje velikim jezičnim modelima samostalno učenje bez ljudski označenih podataka.

min. čitanja

XFacebookWhatsApp

Istraživači iz Tencent AI Laba i Sveučilišta Washington u St. Louisu predstavili su novi okvir za treniranje velikih jezičnih modela (LLM-ova) koji bi mogao ukinuti jednu od najvećih prepreka u razvoju napredne umjetne inteligencije – skupu i sporovoznu izradu označenih skupova podataka.

R-Zero, kako glasi naziv sustava, omogućuje modelima da „uče sami od sebe”. Umjesto da se oslanjaju na ručno pripremljene zadatke i točne odgovore, dva neovisna modela — Challenger i Solver — međusobno se izazivaju i evoluiraju kroz višekratne cikluse pojačanog učenja.

  1. Challenger generira nova pitanja koja su taman na granici trenutnih mogućnosti Solvera.
  2. Solver nastoji riješiti te zadatke i za to prima nagradu.
  3. Najbolji odgovori prema većinskom glasanju postaju nova „točna” rješenja.
  4. Proces se ponavlja, pa oba modela postaju sve sposobnija.

U prvim pokusima R-Zero je primijenjen na otvorenokodne modele Qwen3 i OctoThinker. Nakon tri iteracije treniranja na matematičkim problemima: • Qwen3-4B-Base poboljšao je prosječni rezultat na skupovima zadataka za računanje za 6,49 bodova, a na općim testovima rezoniranja za 7,54 boda. • Veći Qwen3-8B-Base skočio je za 5,51 bod nakon tri kruga.

Najveći napredak zabilježen je već nakon prvog kruga, što, prema autorima, potvrđuje da algoritamski složena „nastavna shema” Challengera nadmašuje statične, unaprijed pripremljene skupove podataka.

Za poslovne korisnike najprivlačniji je aspekt činjenica da R-Zero u potpunosti zaobilazi skupe procese prikupljanja, označavanja i čišćenja podataka, posebice u nišnim područjima gdje kvalitetni skupovi podataka jednostavno ne postoje.

Ipak, autori upozoravaju na važnu zamku: kako zadaci postaju teži, preciznost samostalno generiranih „točnih” odgovora pada – s 79 % u prvom ciklusu na 63 % u trećem. Taj pad pouzdanosti označen je kao ključna prepreka za dugoročno, stabilno poboljšavanje sustava.

Trenutačna je metoda najprikladnija za domene u kojima se ispravnost može jasno provjeriti, poput matematike. Za subjektivnije zadatke – primjerice pisanje marketinškog teksta ili sažimanje poslovnih izvješća – istraživači razmatraju uvođenje trećeg, „kritičarskog” modela koji bi ocjenjivao kvalitetu odgovora po složenijim kriterijima.

Ako se pokaže održivom u širem spektru primjena, R-Zero bi mogao znatno ubrzati razvoj specijaliziranih, visokokvalitetnih jezičnih modela i pritom smanjiti troškove do sada neizostavnog označavanja podataka.

#sveuciliste-washington#tencent-ai-lab#challenger#solver#octothinker

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Ukrajina otvara bojišne podatke za treniranje savezničkih AI sustava
Ministar obrane Mihajlo Fedorov kaže da Kijev partnerima stavlja na raspolaganje milijune bojišnih snimki kako bi ubrzali razvoj autonomnih sustava protiv Rusije.
President Of Ukraine from Україна, CC0, via Wikimedia Commons

min čitanja

Više

Tehnologija

Brzi rast podatkovnih centara prijeti europskoj energetskoj mreži
Europski skok u umjetnoj inteligenciji otvara novu energetsku bitku: mogu li podatkovni centri rasti, a mreža ostati zelena?

min čitanja

Više

Tehnologija

Google Mapama stiže „Ask Maps”: razgovorni AI planira rute i vodi kroz 3D navigaciju
Razgovorni alat „Ask Maps” od danas korisnicima u SAD-u i Indiji nudi personalizirano planiranje ruta, dok Immersive Navigation donosi 3D prikaz kretanja u Google Kartama.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Moskovljani se vraćaju voki-tokijima dok vlasti guše mobilni internet
Nepojasnjeni prekidi mobilnog interneta u Moskvi i St. Petersburgu prisilili su građane da komuniciraju voki-tokijima, dok vlasti guraju državnu „super-aplikaciju” Max.

min čitanja

Više

Tehnologija

Riječki umjetnik Andrej Zbašnik predstavio dijaloški eksperiment s umjetnom inteligencijom
U Galeriji OK predstavljena je knjiga „Dijalozi o životu i umjetnosti“, nastala u dijalogu riječkog umjetnika Andreja Zbašnika i umjetne inteligencije ChatGPT.

min čitanja

Više

Tehnologija

Platforma InferenceSense pretvara mrtvo vrijeme GPU-ova u prihod
Startup FriendliAI lansirao je InferenceSense, sustav koji automatski preusmjerava neiskorištene GPU-ove na plaćene AI inferencije i prihod dijeli s operaterom.

min čitanja

Više

Tehnologija

Opatijska TZ nudi iznajmljivačima bržu prijavu gostiju kroz aplikaciju mVisitor
TZ Opatije predstavila aplikaciju mVisitor koja vlasnicima apartmana omogućuje brzu i besplatnu prijavu gostiju u sustav eVisitor.

min čitanja

Više

Tehnologija

Zagreb razvija prometni portal vrijedan tri milijuna eura
Digitalna platforma omogućit će Zagrepčanima praćenje prometa uživo, prijavu problema i pristup e-uslugama, dok će gradskim službama donijeti preciznije analize i planiranje.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Nvidia lansirala Nemotron 3 Super, hibridni AI od 120 milijardi parametara
Nvidia je predstavila Nemotron 3 Super, hibridni model od 120 milijardi parametara namijenjen jeftinijem pogonu višestrukih AI-agenata u poslovnim okruženjima.

min čitanja

Više

Tehnologija

Googleov tim razvija AI agente koji spontano surađuju bez tvrdokodiranih pravila
Paradigms of Intelligence pokazuje da treniranje AI agenata protiv raznovrsnih protivnika stvara fleksibilne, suradljive sustave prikladne za složene poslovne primjene.

min čitanja

Više

Najčitanije

Biznis

Iva Radić odstupila s čela Journal Media: prijavila sumnje u izvlačenje novca
Osnivačica portala Journal.hr podnijela je ostavku na mjesto direktorice zbog sumnji u višegodišnje nezakonite radnje nad financijama tvrtke, dok je poslovanje portala privremeno zaustavljeno.

min čitanja

Više

Najnovije

Vijesti

Slavonsko selo i senzorno igralište obogatili osječki Zoološki vrt

Vijesti

Splitski taksisti tuže grad: brzopotezna podjela 60 koncesija izazvala pobunu

Lifestyle

Reper Nered nakon 800 kilometara Caminom planira novo hodočašće

Lifestyle

Blues diva Kyla Brox večeras u Puli, dio prihoda za djecu

Vijesti

Vinkovci ugostili fra Ivicu Perića: „Hrvatsko srce školuje tisuće djece u Africi”

Sport

Halilhodžić preuzeo Nantes: „Dugujem mu, ovo mi je posljednji posao”

Politika

Varšava uvodi zabranu noćne prodaje alkohola

Sport

Strukan sudi Dinamu, Pavlešić derbi na Poljudu

Biznis

Churchilla i Austena mijenjaju vidre i ježevi na novim britanskim novčanicama

Lifestyle

Plavi ožujak poziva na pregled: akcija protiv raka debelog crijeva u 13 gradova

Vijesti

Kutleša o naslijeđu kardinala Kuharića: „Ako budemo narod savjesti, bit ćemo narod nade”