CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

29. kolovoza 2025, 06:24

Tencent i američko sveučilište predstavili R-Zero: sustav u kojem se veliki jezični modeli sami usavršavaju

R-Zero omogućuje velikim jezičnim modelima da se treniraju bez ljudskih oznaka, podiže im sposobnost zaključivanja i otvara nova vrata autonomnoj umjetnoj inteligenciji.

min. čitanja

XFacebookWhatsApp

Istraživači iz Tencent AI Laba i Sveučilišta Washington u St. Louisu predstavili su novi okvir nazvan R-Zero koji omogućuje velikim jezičnim modelima (LLM-ovima) da se treniraju bez ijednog ljudski označenog podatka.

Modeli kao vlastiti učitelji

• R-Zero započinje s jednim osnovnim modelom koji se dijeli na dvije uloge: – Challenger (izazivač) generira zadatke točno na granici trenutačnih mogućnosti modela. – Solver (rješavač) nastoji riješiti te sve teže zadatke i za to biva nagrađen.

• Nakon svake runde izazova Solverova rješenja idu na „glasovanje” – većinska odluka određuje točan odgovor, a najraznovrsnija pitanja ulaze u novu trening-datoteku. Ciklus se ponavlja, pri čemu oba modela ko-evoluiraju i postaju sve sposobniji bez ikakve ljudske intervencije.

Rezultati na otvorenim modelima

• Na modelu Qwen3-4B-Base prosječni rezultat na matematičkim testovima porastao je za 6,49 bodova, dok je veći Qwen3-8B-Base napredovao za 5,51 boda nakon tri iteracije.

• Već prva iteracija donijela je znatni skok, što, prema autorima, potvrđuje da „inteligentni kurikulum” koji stvara RL-učen Challenger djeluje bolje od slučajno generiranih zadataka.

• Stečene vještine s matematike prenijele su se i na opće domene: isti Qwen3-4B-Base ostvario je poboljšanje od 7,54 boda na skupovima MMLU-Pro i SuperGPQA.

• R-Zero se pokazao učinkovitom predpripremom; modeli koji su prošli ovaj proces kasnije su postizali dodatna poboljšanja kad su naknadno fino podešeni na klasičnim, ručno označenim podacima.

Zašto je to važno za industriju

Dok je prikupljanje i označavanje velikih korpusa podataka skupo i sporo, R-Zero preskače taj usko grlo. Chengsong Huang, suautor rada, ističe da je riječ o „putu prema stvaranju AI-a koji može nadmašiti ljudske sposobnosti jer više nije ograničen ljudskim znanjem ili podacima”.

Izazovi koji ostaju

• Točnost „samogeneriranih” odgovora pada kako zadaci postaju teži: s 79 % u prvoj na 63 % u trećoj iteraciji u usporedbi s referentnim GPT-4 modelom. Autori priznaju da je dugoročno održavanje napretka bez plateau-efekta „značajan istraživački izazov”.

• Okvir zasad najbolje radi u disciplinama s jasnim kriterijem točnosti, primjerice matematici. Za subjektnije zadatke istraživači razmatraju dodavanje trećeg agenta – Verifikatora – koji bi procjenjivao kvalitetu odgovora prema finijim kriterijima.

R-Zero tako otvara vrata autonomnim sustavima koji bi jednog dana mogli učiti i o objektivnim i o subjektivnim problemima – bez da itko ručno priprema podatke.

#sveuciliste-washington#tencent#saint-louis#chengsong-huang
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Novi opoziv Cybertrucka: Teslinu „neuništivom” pick-upu prijeti ispadanje kotača
Tesla opoziva još 173 Cybertrucka jer pogrešna mast može uzrokovati pucanje kočionih diskova i otpadanje kotača, što je već jedanaesta greška na kontroverznom električnom pick-upu.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja
Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”
Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej
Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku
Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi
Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete
Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja
Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Supetarska gradonačelnica o napadu na Vukovića: prijetnje ne smiju postati normalne
Gradonačelnica Supetra osudila je fizički napad na novinara Sinišu Vukovića na splitskoj Rivi i pozvala građane da prijavljuju sve prijetnje.

min čitanja

Više

Politika

Plenković u Novoj Gradiški: HDZ-ovi kandidati nude stabilnost i razvoj
Premijer Andrej Plenković u Novoj Gradiški podržao HDZ-ove kandidate Bernardina Trnku i Brunu Bušića, naglasivši nužnost stabilnog vodstva i nastavka razvojnih projekata.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana
KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Kvarner u Zagrebu protiv Cibone lovi posljednji vlak za doigravanje

Sport

Vrhunac drame u Trećoj NL Istok: Marsonia vreba povratak na vrh

Sport

Klapa HRM-a „Sveti Juraj” pjesmom podiže moral Vatrenima

Vijesti

Dvostruka akcija HGSS-a Split: isti dan spašene dvije ozlijeđene turistkinje

Sport

Riječki boksač Ramljak u polufinalu državnog prvenstva

Politika

Ivošević optužio Šutu: grad ignorira napade na novinare

Vijesti

Skele oko Tuđmanova spomenika: redovito održavanje traje do 15. svibnja

Vijesti

Ronioci najavili čišćenje podmorja uz Sustipan povodom blagdana sv. Duje

Sport

Đakovo Croatia pod pritiskom: derbi začelja protiv Hrvatskog dragovoljca odlučuje sezonu

Sport

Rijeka glatko slavila u Vukovaru i vratila treće mjesto pred finale Kupa

Lifestyle

Renata Lovrinčević Buljan usred Sudamje demonstrirala hitnu „rehabilitaciju”