CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

25. rujna 2025, 08:22

Novi RL pristup unosi paralelno razmišljanje u velike jezične modele

Framework Parallel-R1 modelima omogućuje grananje misaonih tokova, čime poboljšava točnost rješenja bez potrebe za većim modelima.

min. čitanja

XFacebookWhatsApp

Istraživači iz Tencent AI Lab Seattle i Sveučilišta Maryland, College Park predstavili su Parallel-R1, tehniku potkrijepljenu učenjem kroz potkrepljenje (reinforcement learning, RL) koja velikim jezičnim modelima (LLM-ovima) omogućuje da u vrijeme izvođenja zadatka generiraju više paralelnih tokova zaključivanja i tako dolaze do točnijih odgovora.

„Riječ je o prvom RL okviru koji omogućuje paralelno razmišljanje kod složenih zadataka iz stvarnog svijeta”, istaknuli su autori rada.

Zašto paralelno razmišljanje?

• Paradigma grana-i-glasa (best of N) ili naprednije metode poput Monte Carlo Tree Searcha i Tree of Thoughtsa dosad su tražile vanjske sustave i ručno definirana pravila. • Nadogradnja putem nadziranog finog ugađanja često ovisi o rijetkim, skupo označenim podacima. • RL obećava skalabilnost, ali pati od „cold-start” problema i složenog dizajna nagrada.

Kako radi Parallel-R1

  1. Dvostupanjski format razmišljanja
    – Exploration: model po pojavi oznake <Parallel> otvara više blokova <Path> s različitim misaonim tokovima.
    – Summary: iz nalaza formira sažetak <Summary> i nastavlja glavnu nit.

  2. Trodijelni proces učenja
    • Cold-Start: model se fino ugađa na oko 7 000 AI-generiranih primjera paralelnog razmišljanja iz skupa GSM8K, kako bi svladao sam format.
    • RL na lakšoj matematici: uvodi se dvojak sustav nagrađivanja – točnost rješenja i pravilna uporaba strukture.
    • RL na složenijoj matematici: sposobnost se proširuje na zahtjevnije zadatke.

  3. Alternirajuća nagrada
    Naizmjenično nagrađivanje točnog odgovora i dosljednog paralelnog formata pokazalo se najboljim kompromisom između performansi i brzine.

Rezultati

Model Qwen-3-4B-Base treniran Parallel-R1 metodom nadmašio je sve usporedne inačice na standardnim matematičkim benchmark-ovima poput AIME, AMC i MATH. Autori tvrde da se time „otključava veća snaga zaključivanja bez skupe ekspanzije modela”, što je posebno privlačno za poduzeća koja žele jaču analitičku inteligenciju, ali ne i dodatne troškove treniranja golemih mreža.

Šira slika

Google je nedavno pripisao uspjeh svog modela Gemini Deep Think na Međunarodnoj matematičkoj olimpijadi upravo sposobnosti razmatranja više misaonih tokova. Parallel-R1 donosi sličnu strategiju u otvoreniji i skalabilniji RL okvir, pa bi se „paralelno razmišljanje” moglo ubrzo nametnuti kao standardni pristup za složene zadatke logičkog zaključivanja.

#google#medjunarodna-matematicka-olimpijada#tencent-ai-lab#sveuciliste-maryland#gsm8k

Slično

Tehnologija

Google i NextEra oživljavaju nuklearku u Iowi za pogon podatkovnih centara
Napuštena nuklearna elektrana Duane Arnold predviđena je za ponovno pokretanje 2029. zahvaljujući partnerstvu između Googlea i NextEra Energyja, koje bi trebalo osigurati 600 MW stalne struje za rastuću mrežu podatkovnih centara u Iowi.

min čitanja

Više

Tehnologija

Google i UC Santa Barbara razvili "štedljive" tehnike za velike jezične agente
Nova studija pokazuje kako agentima velikih jezičnih modela dati „osjećaj za novčanik” i tako uštedjeti tokene, vrijeme i novac.

min čitanja

Više

Tehnologija

Neprofitna inicijativa Fulu plaća hakere da ožive „mrtve” uređaje
Fulu nudi novčane nagrade za hakere koji oslobode potrošače ograničenja i produže vijek trajanja uređaja koje su proizvođači već otpisali.

min čitanja

Više

Tehnologija

Autorica priznala golemu pogrešku u bestseleru o umjetnoj inteligenciji
Karen Hao na X-u priznala da je u knjizi „Empire of AI” pogrešno procijenila potrošnju vode Googleova podatkovnog centra – i to za faktor 1.000.

min čitanja

Više

Tehnologija

Stručnjaci upozoravaju: aplikacije za seks-igračke prikupljaju osjetljive podatke
Rastuće tržište pametnih seks-igračaka donosi i tamnu stranu: aplikacije bilježe intimne navike korisnika, a prikupljeni podaci mogu završiti kod posrednika i oglašivača.

min čitanja

Više

Tehnologija

Autonomni AI programeri još nisu spremni za pogon
Tvrtke koje uvode AI agente za pisanje koda bilježe pad produktivnosti kad zanemare kontekst i prilagodbu procesa; ključna je nova disciplina inženjeringa konteksta.

min čitanja

Više

Tehnologija

Aplikacija Nomiea djeci otvara svijet klavira kroz igru
Nomiea, nova aplikacija koja djeci kroz igru otkriva klavir i glazbenu teoriju, predstavljena je u Dječjoj kući uz podršku stručnjaka i niz interaktivnih radionica.

min čitanja

Više

Tehnologija

Orqin hackathon na EFOS-u: studenti rješavali izazove, a tvrtka lovi nove talente
Na EFOS-u je održan Orqin hackathon na kojem su studenti radili na strategiji za usklađivanje triju Orqinih tržišta – vojnog, potrošačke elektronike i obrazovnog – dok brzo rastuća osječka tvrtka traži svježe ideje i nove zaposlenike.

min čitanja

Više

Tehnologija

Del Toro upozorava: „Algoritam ne smije istisnuti ljudsku maštu“
Guillermo del Toro kritizira bezrezervno korištenje umjetne inteligencije u filmu i otkriva detalje o svom novom, za Zlatni globus nominiranom, „Frankensteinu“.

min čitanja

Više

Tehnologija

AI2 lansirao Olmo 3.1, dosad najmoćniji model s naglaskom na učinkovitost i kontrolu
Allen Institute for AI predstavio je Olmo 3.1, novu i snažniju generaciju jezičnih modela usmjerenih na učinkovitost, transparentnost i precizno praćenje uputa.

min čitanja

Više

Najčitanije

Politika

Izrael optužuje australske vlasti nakon krvave pucnjave na Hanuku u Sydneyju
Plaža Bondi pretvorila se u poprište krvoprolića tijekom židovskog blagdana, a izraelski dužnosnici optužuju australsku vladu za zanemarivanje prijetnji antisemitizma.

min čitanja

Više

Vijesti

Pucnjava na Sveučilištu Brown: dvoje studenata ubijeno, napadač u bijegu
Krvavi napad usred ispitnog roka pretvorio je kampus ugledne američke institucije u poprište tragedije; policija provodi opsežnu potragu za naoružanim napadačem.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Vijesti

U Bavarskoj uhićena petorka osumnjičena za planiranje napada na božićni sajam
Petorica muškaraca egipatskog, sirijskog i marokanskog podrijetla uhićeni su u Bavarskoj zbog sumnje da su planirali islamistički napad vozilom na božićni sajam u Dingolfingu.

min čitanja

Više

Vijesti

Dvostruka tragedija u Bedekovčini: suprugu ubio pa sebi oduzeo život
U Bedekovčini je tijekom noći 43-godišnjak navodno usmrtio suprugu, a potom počinio samoubojstvo; policija provodi očevid i najavljuje dodatne informacije.

min čitanja

Više

Nogomet

By http://www.mancity.com/, Fair use, https://en.wikipedia.org/w/index.php?curid=51208953

Arsenal u 94. minuti slomio Wolves i pobjegao Cityju na pet bodova
Kasni autogol Mosquere donio je Arsenalu dramatičnih 2-1 protiv fenjeraša Wolvesa i pet bodova bijega ispred Manchester Cityja.

min čitanja

Više

Nogomet

Perišićev potez presudio triler u Eindhovenu
Hrvatski reprezentativac asistirao za preokret u ludoj utakmici, a PSV povećao prednost na vrhu Eredivisie.
Autor Антон Зайцев - https://www.soccer.ru/galery/1054721/photo/731938, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=71196380

min čitanja

Više

Vijesti

Pucnjava na Sveučilištu Brown: dvoje mrtvih, devet ranjenih; napadač još u bijegu
Dvoje studenata ubijeno je, a devet osoba ranjeno u pucnjavi u zgradi inženjerstva na Sveučilištu Brown u Providenceu; policija traga za osumnjičenim muškarcem u crnom.

min čitanja

Više

Vijesti

Prvi slučaj kuge malih preživača u Hrvatskoj
Potvrđen prvi slučaj kuge malih preživača u naselju Bogdanovići kod Prgometa; primjenjuju se stroge mjere suzbijanja i obaviještena je Europska unija.

min čitanja

Više

Najnovije

Politika

Ministarstvo odbija posebnu pomoć poljoprivrednicima iz Bošnjaka

Vijesti

Student Media Fest pretvorio osječku Akademiju u živo medijsko laboratorij

Vijesti

Usprkos afričkoj svinjskoj kugi, zimske svinjokolje ne jenjavaju

Vijesti

Saša Ilić novim romanom „Rt” proširio hrabri antiratni opus

Vijesti

Masakr na australskoj plaži

Vijesti

Zagreb gradi prvu veliku co-living oazu: 400 stanara u novom „mini gradu” u Svetoj Klari

Vijesti

Osječke osobe s intelektualnim teškoćama izvele modernu „Crvenkapicu” i upozorile na izazove zapošljavanja

Sport

Bilandžić se vraća u Gradski vrt: osječki as lovi K-1 pojas pred domaćom publikom

Vijesti

U Vinkovcima zapaljena treća adventska svijeća radosti

Vijesti

Humboldt Forum između dijaloga i prijepora

Vijesti

Šest prometnih nesreća u Slavoniji i Baranji: policija upozorava vozače