CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

1. rujna 2025, 11:22

R-Zero obećava samostalno učenje velikih jezičnih modela bez ljudskih oznaka

Tencent i Sveučilište Washington razvili su R-Zero, okvir koji omogućuje velikim jezičnim modelima samostalno učenje bez ljudski označenih podataka.

min. čitanja

Istraživači iz Tencent AI Laba i Sveučilišta Washington u St. Louisu predstavili su novi okvir za treniranje velikih jezičnih modela (LLM-ova) koji bi mogao ukinuti jednu od najvećih prepreka u razvoju napredne umjetne inteligencije – skupu i sporovoznu izradu označenih skupova podataka.

R-Zero, kako glasi naziv sustava, omogućuje modelima da „uče sami od sebe”. Umjesto da se oslanjaju na ručno pripremljene zadatke i točne odgovore, dva neovisna modela — Challenger i Solver — međusobno se izazivaju i evoluiraju kroz višekratne cikluse pojačanog učenja.

  1. Challenger generira nova pitanja koja su taman na granici trenutnih mogućnosti Solvera.
  2. Solver nastoji riješiti te zadatke i za to prima nagradu.
  3. Najbolji odgovori prema većinskom glasanju postaju nova „točna” rješenja.
  4. Proces se ponavlja, pa oba modela postaju sve sposobnija.

U prvim pokusima R-Zero je primijenjen na otvorenokodne modele Qwen3 i OctoThinker. Nakon tri iteracije treniranja na matematičkim problemima: • Qwen3-4B-Base poboljšao je prosječni rezultat na skupovima zadataka za računanje za 6,49 bodova, a na općim testovima rezoniranja za 7,54 boda. • Veći Qwen3-8B-Base skočio je za 5,51 bod nakon tri kruga.

Najveći napredak zabilježen je već nakon prvog kruga, što, prema autorima, potvrđuje da algoritamski složena „nastavna shema” Challengera nadmašuje statične, unaprijed pripremljene skupove podataka.

Za poslovne korisnike najprivlačniji je aspekt činjenica da R-Zero u potpunosti zaobilazi skupe procese prikupljanja, označavanja i čišćenja podataka, posebice u nišnim područjima gdje kvalitetni skupovi podataka jednostavno ne postoje.

Ipak, autori upozoravaju na važnu zamku: kako zadaci postaju teži, preciznost samostalno generiranih „točnih” odgovora pada – s 79 % u prvom ciklusu na 63 % u trećem. Taj pad pouzdanosti označen je kao ključna prepreka za dugoročno, stabilno poboljšavanje sustava.

Trenutačna je metoda najprikladnija za domene u kojima se ispravnost može jasno provjeriti, poput matematike. Za subjektivnije zadatke – primjerice pisanje marketinškog teksta ili sažimanje poslovnih izvješća – istraživači razmatraju uvođenje trećeg, „kritičarskog” modela koji bi ocjenjivao kvalitetu odgovora po složenijim kriterijima.

Ako se pokaže održivom u širem spektru primjena, R-Zero bi mogao znatno ubrzati razvoj specijaliziranih, visokokvalitetnih jezičnih modela i pritom smanjiti troškove do sada neizostavnog označavanja podataka.

#sveuciliste-washington#tencent-ai-lab#challenger#solver#octothinker

Slično

Tehnologija

Pao Google: jutarnji kolaps tražilice, Gmaila i YouTubea pogodio i Hrvatsku
Opsežan jutarnji prekid rada Googleovih servisa zahvatio je Hrvatsku i veći dio jugoistočne Europe, a problemi se šire i na zapad kontinenta.

min čitanja

Više

Tehnologija

Inženjer Manjunatha Jagalur donio pravedniji i brži algoritam za traženje poslova
Strojno učenje pomoglo je globalnoj platformi da brže i poštenije spaja poslodavce s kandidatima.

min čitanja

Više

Tehnologija

Xero predstavio JAX: pametni agent koji automatizira knjiženja, ali zadržava kontrolu u rukama korisnika
JAX, AI sustav tvrtke Xero, obećava brže knjiženje i analize uz stroge sigurnosne mjere i punu kontrolu korisnika.

min čitanja

Više

Tehnologija

Špijunski program Stealerium automatski ucjenjuje žrtve snimkama s web-kamere
Novi otvoreno-izvorsni malver Stealerium koristi se u masovnim kampanjama krađe podataka, a posebno je opasan jer automatski snima korisnike dok gledaju pornografiju i time stvara ucjenjivački materijal.

min čitanja

Više

Tehnologija

LangChain lansirao alphu verzije 1.0: stabilniji LangGraph i nova arhitektura agenata
Alfa izdanja LangChaina 1.0 i LangGrapha donose stabilniju arhitekturu agenata, paket za kompatibilnost sa starim projektima i najavu finalne verzije u listopadu.

min čitanja

Više

Tehnologija

Studija: potpuna elektrifikacija automobila mogla bi EU-u uštedjeti do 45 milijardi eura godišnje
Operatori punionica navode da bi potpuna elektrifikacija automobila mogla donijeti Europskoj uniji do 45 milijardi eura godišnje uštede.

min čitanja

Više

Tehnologija

Samo desetina Draghijevih tehnoloških preporuka provedena u godini dana
Liberalno izvješće upozorava da EU zaostaje u digitalizaciji, a geoblokiranje ostaje prepreka jedinstvenom tržištu.

min čitanja

Više

Tehnologija

OpenAI objavio vodič za tvrtke: kako preživjeti i uspjeti u doba umjetne inteligencije
Novi OpenAI-jev izvještaj donosi deset preporuka kako korporacije mogu ubrzati, sigurno upravljati i skalirati primjenu generativne umjetne inteligencije.

min čitanja

Više

Tehnologija

Nobelovci u HRT-ovoj emisiji „Nobel Spirit” raspravljali o budućnosti personalizirane medicine
Ugledni nobelovci u emisiji „Nobel Spirit” na HRT-u raspravljali su o otvorenoj znanosti, interdisciplinarnom pristupu i personaliziranoj medicini te najavili veliku AI konferenciju u Dubrovniku 2026.
By MZOŠ - MZOŠ, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=152338089

min čitanja

Više

Tehnologija

Europska komisija odbila odgoditi primjenu Zakona o podacima
Komisija odbila dvogodišnju odgodu koju je tražila industrija, Zakon o podacima primjenjuje se prema planu.

min čitanja

Više

Najčitanije

Politika

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Moskva odbacuje ideju europskih postrojbi u Ukrajini: „O tome nema pregovora”
Rusija nazvala neprihvatljivom najavu europskih mirovnih snaga u Ukrajini, dok Njemačka ublažava ton, a Kijev u Parizu traži sigurnosna jamstva.
President Of Ukraine from Україна, CC0, via Wikimedia CommonsAutor European People's Party - EPP Lead Candidate Multimedia Content, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=148344970

min čitanja

Više

Vijesti

Suđenje Banožiću ulazi u fazu vještačenja o prometu
Na Općinskom sudu u Vinkovcima danas svjedoče prometni vještaci u postupku protiv bivšeg ministra zbog prometne nesreće s tragičnim ishodom.

min čitanja

Više

Ostalo

Prekid etape Vuelte u Bilbau zbog prosvjeda: zamrznuta vremena, nema pobjednika
Propalestinski prosvjednici oborili su zaštitne ograde i prekinuli jedanaestu etapu Vuelte u Bilbau, zbog čega su vremena zamrznuta tri kilometra prije cilja, a pobjednik nije proglašen.
By Martino Photos - File:David_Gaudu,_Tadej_Pogačar,_Jonas_Vingegaard,_2023_Paris-Nice_(52929456925)_(cropped).jpg, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=169677278

min čitanja

Više

Najnovije

Lifestyle

Debljanje se prvo vidi na jeziku, upozorava američki liječnik

Tehnologija

Pao Google: jutarnji kolaps tražilice, Gmaila i YouTubea pogodio i Hrvatsku

Sport

Kalik o bakljama i pritisku Torcide: „Navikneš se, samo treba pobijediti sljedeću”

Sport

Splitski Grom i Torcidaš idu po svjetske udarce u Liverpoolu

Vijesti

Divljanje u Đelekovcu: 114 km/h kroz naselje gdje je ograničenje 50

Politika

Thomas Bauer o premlaćivanju veterana u Beogradu: „U nedostatku pravih ustaša dobri su i ovi domaći”

Sport

Kup Splita: Zadar, Bosna, Široki i Split slave 80 godina “žutih”

Sport

Teško ozlijeđen bivši marokanski nogometaš dok je pomagao stradalima u nesreći

Sport

Marcella Šaini vraća se kući i preuzima dirigentsku palicu Velog Vrha

Politika

Trump najavljuje nove pokušaje posredovanja između Rusije i Ukrajine

Vijesti

Rujanski povratak ljeta: do 30 °C i obilje sunca, ali magla i kratki pljuskovi vrebaju unutrašnjost