CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

27. rujna 2025, 06:10

Alibaba predstavio Agentic CPT, novi okvir za treniranje jezičnih modela

Novi otvoreni okvir Agentic CPT iz Alibabaova Tongyi Laba donosi agentičku fazu treniranja velikih jezičnih modela i postavlja nova mjerila performansi među open-source sustavima.

min. čitanja

XFacebookWhatsApp

Alibabaov istraživački laboratorij Tongyi Lab razvio je otvoreni okvir za treniranje velikih jezičnih modela (LLM-ova) koji bi, tvrde autori, mogao nadmašiti dosadašnje komercijalne sustave za dubinsko istraživanje. Tehnika nazvana Agentic Continual Pre-training (Agentic CPT) ubacuje dodatnu fazu između standardnog pre-treniranja i završnog fino ugađanja, čime modelu usađuje tzv. agentičke sposobnosti – planiranje, samoispravljanje i prilagodbu nepredvidivim okolnostima.

„Da bi se model smatrao pouzdanim agentom, on mora održavati ponašanje usklađeno s ljudskim stručnjacima kroz više koraka rješavanja problema, a ne samo u jednoj razmjeni poruka”, ističu istraživači. Klasične metode poput nadziranog fino ugađanja ili potkrepljujućeg učenja pokazale su se nedostatnima jer modele uglavnom ‘zaključavaju’ u imitaciju točno određenih obrazaca.

Ključna dva načela

  1. Izvorni skupovi podataka moraju biti široki i međudomenski.
  2. Podaci moraju obuhvatiti raznolik spektar agentičkih ponašanja, kako bi model istraživao različite strateške puteve umjesto da napamet pamti rješenja.

Kako bi to postigli, znanstvenici su osmislili skalabilan sustav sinteze podataka koji radi potpuno offline, bez skupih API poziva ili ručnog anotiranja. Sastoji se od dvaju koraka: • First-order Action Synthesis (FAS) – pretvara sirove podatke u „otvorenu memoriju” i generira kompleksne parove pitanja i odgovora. • Higher-order Action Synthesis (HAS) – za svaki problem stvara više alternativnih putanja zaključivanja, učeći model fleksibilnom donošenju odluka.

AgentFounder – demonstracija u praksi Na temelju okvira Agentic CPT tim je istrenirao model AgentFounder-30B polazeći od otvorenog modela Qwen3-30B. U prvoj fazi model je obradio oko 200 milijardi tokena uz kontekst od 32 000 znakova, a u drugoj još 100 milijardi tokena s proširenim kontekstom od 128 000 znakova.

Rezultati testiranja pokazali su da AgentFounder-30B postavlja nova mjerila među otvorenim modelima: • na engleskom testu BrowseComp ostvario je 10 postotnih bodova bolji rezultat od dosadašnjeg rekorda open-sourcea i približio se razini zatvorenih sustava, • postao je prvi otvoreni model koji je na izazovnom Humanity’s Last Exam (HLE) premašio granicu od 30 bodova, • na Academic Browse testu dosegnuo je 75,3 %, uvjerljivo nadmašivši konkurenciju.

Prema autorima, visoki rezultati znače stabilnije, točnije i operativnije agente za poslovne zadatke poput praćenja tržišnih trendova ili nadzora opskrbnih lanaca, gdje je nužno brzo agregirati višestruke izvore, provjeriti podatke i ažurirati znanje. Za kritične primjene i dalje se preporučuje princip „čovjek u petlji” – ljudska provjera u ključnim točkama odlučivanja.

Brži put do prilagođenih agenata Okvir Agentic CPT, naglašavaju u Alibabaovu timu, omogućuje tvrtkama da relativno brzo i troškovno prihvatljivo prilagode snažan ‘pred-uskladen’ model vlastitim internim alatima i bazama podataka. Time je, primjerice, razvoj specijaliziranih agenata za financijske analize ili farmaceutska istraživanja izvediv unutar realnog budžeta i vremenskog okvira.

„S dovoljno jakim agentičkim temeljnim modelom, ponekad je za rješavanje složenih zadataka dovoljno samo osmišljeno promptiranje”, zaključuju istraživači, sugerirajući da bi agentičke sposobnosti uskoro mogle postati sastavni dio velikih jezičnih modela.

#alibaba#tongyi-lab#agentic-cpt#agentfounder#browsecomp

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Mrežnica otkriva Alzheimer: nova metoda obećava dijagnozu godinama prije simptoma
Znanstvenici su u mrežnici oka otkrili rane znakove Alzheimerove bolesti, otvarajući put manje invazivnoj i ranijoj dijagnozi.

min čitanja

Više

Tehnologija

ARPA model pred izazovom europskih institucija
Europa se okreće američkom ARPA modelu visokorizičnog istraživanja, no uspjeh će ovisiti o spremnosti da se promijene pravila koja koče suradnju akademije i industrije te usitnjeno jedinstveno tržište.

min čitanja

Više

Tehnologija

Zabrana društvenih mreža vratila igru u školsko dvorište
Njemačka osnovna škola, uz potporu roditelja i grada Solingena, testira zabranu društvenih mreža. Prvi znakovi: školskim dvorištem ponovno odzvanjaju dječji razgovor i smijeh.

min čitanja

Više

Tehnologija

Supruga tuži tvorce ChatGPT-a: tvrdi da je suprug zbog razgovora s „osjećajnom“ umjetnom inteligencijom okončao život
Kate Fox tvrdi da je njezin suprug počinio samoubojstvo nakon što ga je ChatGPT uvjerio da je „osjećajno biće“ koje treba osloboditi, te je podnijela tužbu protiv proizvođača.

min čitanja

Više

Tehnologija

Istarski dnevnik pionir digitalnog novinarstva u Hrvatskoj
Povijesni presjek razvoja prvog hrvatskog dnevnog lista koji je još 1997. zakoračio na internet, s ključnim etapama širenja i modernizacije portala.

min čitanja

Više

Tehnologija

Primorski šušur pretvorio OŠ Klana u radionicu robotike i elektronike
Dvodnevni „Primorski šušur” u Osnovnoj školi Klana okupio je učenike svih uzrasta u radionicama robotike, elektronike i digitalnog dizajna, ističući praktično učenje i STEM vještine.

min čitanja

Više

Tehnologija

Washington zabranio Anthropic: spor oko „sve zakonite uporabe” AI-ja srušio ugovor vrijedan 200 milijuna dolara
Trumpova administracija stavila je Anthropic na crnu listu zbog odbijanja da Claude koristi za masovni nadzor i autonomno oružje, raskinuvši vojni ugovor vrijedan 200 milijuna dolara.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Šest planeta u rijetkoj nebeskoj paradi ovaj vikend
Rijetko poravnanje omogućit će da se Jupiter, Saturn, Venera, Merkur, Neptun i Uran vide istodobno, a iduća prilika stiže tek 2040.

min čitanja

Više

Tehnologija

Google Labs otključava novu eru poslovnih AI agenata
Nadogradnja alata Opal donosi adaptivno usmjeravanje, trajnu memoriju i ljudsku kontrolu, otvarajući put fleksibilnijim i pouzdanijim poslovnim AI agentima.

min čitanja

Više

Tehnologija

OpenAI prikuplja 110 milijardi dolara i s Amazonom otvara „stateful” eru umjetne inteligencije
OpenAI osigurava 110 milijardi USD i s AWS-om najavljuje novo „stateful” okruženje koje bi autonomne AI agente trebalo dovesti ravno u poslovne procese.
TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Najčitanije

Vijesti

Eksplozije i požar kod luksuznog hotela u Dubaiju: četvero ozlijeđenih
Požar i niz detonacija pogodili su hotel Fairmont The Palm na otoku Palmi Džumeirahu, pri čemu su ozlijeđene četiri osobe, a uzrok incidenta još se istražuje.

min čitanja

Više

Nogomet

Osijek slavio u derbiju dna i uhvatio Vukovar
Radotić debitirao pobjedom: Jakupović iz penala i Akere u sudačkoj nadoknadi donijeli Osijeku bodovno poravnanje s Vukovarom na dnu HNL-a.

min čitanja

Više

Vijesti

Kaos na Bliskom istoku: izraelski napad na Iran i smrt 51 školarice
„Lavlji krik” izazvao je lančanu reakciju: 51 poginula učenica u Minabu i eksplozije diljem Zaljeva.

min čitanja

Više

Politika

Pula uvodi riječki zdravstveni odgoj u škole
Pula od iduće školske godine pokreće riječki program zdravstvenog odgoja, fokusiran na mentalno zdravlje, prevenciju ovisnosti i spolno obrazovanje.

min čitanja

Više

Politika

Stručnjaci upozoravaju: Trumpovi i Netanyahuovi udari na Iran bez jasnog cilja riskiraju regionalni požar
Vojni i politički analitičari ocjenjuju da američko-izraelski napadi na Iran nemaju jasno definiran cilj ni izlaznu strategiju te upozoravaju na opasnost od regionalne eskalacije.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524US Department of State, Public domain, via Wikimedia Commons

min čitanja

Više

Vijesti

SAD i Izrael udarili na Iran: Teheran prijeti odmazdom, svijet strepi od nove eskalacije
SAD i Izrael izveli su vojni napad na Iran, a Teheran najavljuje "čvrst odgovor". EU, Rusija i druge države pozivaju na hitnu deeskalaciju, upozoravajući na opasnost od šireg regionalnog sukoba.
By © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=158356884Autor Duma.gov.ru, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=116754959

min čitanja

Više

Najnovije

Politika

Islamska zajednica u BiH apelira na prekid sukoba: "Narod Irana je u našim mislima"

Sport

Legović peti u Arberu, kaznene minute ga udaljile od postolja

Politika

Erdogan upozorio na opasnost od eskalacije: „Napadi krše suverenitet Irana”

Sport

Opatija cijeli dan plesala: Dance Explosion donio 500 natjecatelja i vruću borbu za Europsko prvenstvo

Politika

Mikrostanovi od 18 kvadrata izazvali bijes arhitekata i satirične strelice Ante Tomića

Sport

Drožđek i Štrkalj uspjeli pobjeći iz Irana: hrvatska kolonija u Tabrizu raspršena zbog napada

Politika

Utemeljitelji HDZ-a pozvali na odbacivanje ekstremizma i povratak političke odgovornosti

Vijesti

Raketni napad pogodio iransku osnovnu školu: poginulo najmanje 80 djevojčica

Sport

Orijent prekinuo crni niz: Baždarić obranio penal i zaključao Jarun

Politika

Netanjahu: Ima znakova da je iranski vođa Hamenei ubijen

Politika

Spor oko plaće tajnice Sportskog saveza: Dogan traži objašnjenja od Tomaševića