Tehnologija

27. rujna 2025, 06:10

Alibaba predstavio Agentic CPT, novi okvir za treniranje jezičnih modela

Novi otvoreni okvir Agentic CPT iz Alibabaova Tongyi Laba donosi agentičku fazu treniranja velikih jezičnih modela i postavlja nova mjerila performansi među open-source sustavima.

min. čitanja

Alibabaov istraživački laboratorij Tongyi Lab razvio je otvoreni okvir za treniranje velikih jezičnih modela (LLM-ova) koji bi, tvrde autori, mogao nadmašiti dosadašnje komercijalne sustave za dubinsko istraživanje. Tehnika nazvana Agentic Continual Pre-training (Agentic CPT) ubacuje dodatnu fazu između standardnog pre-treniranja i završnog fino ugađanja, čime modelu usađuje tzv. agentičke sposobnosti – planiranje, samoispravljanje i prilagodbu nepredvidivim okolnostima.

„Da bi se model smatrao pouzdanim agentom, on mora održavati ponašanje usklađeno s ljudskim stručnjacima kroz više koraka rješavanja problema, a ne samo u jednoj razmjeni poruka”, ističu istraživači. Klasične metode poput nadziranog fino ugađanja ili potkrepljujućeg učenja pokazale su se nedostatnima jer modele uglavnom ‘zaključavaju’ u imitaciju točno određenih obrazaca.

Ključna dva načela

Izvorni skupovi podataka moraju biti široki i međudomenski.
Podaci moraju obuhvatiti raznolik spektar agentičkih ponašanja, kako bi model istraživao različite strateške puteve umjesto da napamet pamti rješenja.

Kako bi to postigli, znanstvenici su osmislili skalabilan sustav sinteze podataka koji radi potpuno offline, bez skupih API poziva ili ručnog anotiranja. Sastoji se od dvaju koraka: • First-order Action Synthesis (FAS) – pretvara sirove podatke u „otvorenu memoriju” i generira kompleksne parove pitanja i odgovora. • Higher-order Action Synthesis (HAS) – za svaki problem stvara više alternativnih putanja zaključivanja, učeći model fleksibilnom donošenju odluka.

AgentFounder – demonstracija u praksi Na temelju okvira Agentic CPT tim je istrenirao model AgentFounder-30B polazeći od otvorenog modela Qwen3-30B. U prvoj fazi model je obradio oko 200 milijardi tokena uz kontekst od 32 000 znakova, a u drugoj još 100 milijardi tokena s proširenim kontekstom od 128 000 znakova.

Rezultati testiranja pokazali su da AgentFounder-30B postavlja nova mjerila među otvorenim modelima: • na engleskom testu BrowseComp ostvario je 10 postotnih bodova bolji rezultat od dosadašnjeg rekorda open-sourcea i približio se razini zatvorenih sustava, • postao je prvi otvoreni model koji je na izazovnom Humanity’s Last Exam (HLE) premašio granicu od 30 bodova, • na Academic Browse testu dosegnuo je 75,3 %, uvjerljivo nadmašivši konkurenciju.

Prema autorima, visoki rezultati znače stabilnije, točnije i operativnije agente za poslovne zadatke poput praćenja tržišnih trendova ili nadzora opskrbnih lanaca, gdje je nužno brzo agregirati višestruke izvore, provjeriti podatke i ažurirati znanje. Za kritične primjene i dalje se preporučuje princip „čovjek u petlji” – ljudska provjera u ključnim točkama odlučivanja.

Brži put do prilagođenih agenata Okvir Agentic CPT, naglašavaju u Alibabaovu timu, omogućuje tvrtkama da relativno brzo i troškovno prihvatljivo prilagode snažan ‘pred-uskladen’ model vlastitim internim alatima i bazama podataka. Time je, primjerice, razvoj specijaliziranih agenata za financijske analize ili farmaceutska istraživanja izvediv unutar realnog budžeta i vremenskog okvira.

„S dovoljno jakim agentičkim temeljnim modelom, ponekad je za rješavanje složenih zadataka dovoljno samo osmišljeno promptiranje”, zaključuju istraživači, sugerirajući da bi agentičke sposobnosti uskoro mogle postati sastavni dio velikih jezičnih modela.

#alibaba #tongyi-lab #agentic-cpt #agentfounder #browsecomp

Slično

Tehnologija

Odašiljač Milinac donosi signal Boroviku i okolnim selima

Dugoočekivana gradnja 48-metarskog stupa riješit će višegodišnji problem nedostatka mobilne i internetske veze u Breznici Đakovačkoj, Milincu, Paučju i na jezeru Borovik.

min čitanja

Više

Tehnologija

Robotaksiji kucaju na europska vrata: Njemačka započinje 2026., Zagreb čeka Verne

Europa se sprema za veliku premijeru autonomnih vozila: Uber i Lyft kreću u Njemačkoj 2026., dok Zagreb čeka Rimčev Verne.

min čitanja

Više

Tehnologija

Digitalni identitet u EU: dok Britanija raspravlja, Europa već živi s e-osobnim iskaznicama

Dok Ujedinjeno Kraljevstvo tek raspravlja o osobnim iskaznicama, u Europskoj uniji fizičke i digitalne verzije već su svakodnevica, a do 2026. svaki će građanin dobiti svoj digitalni identitet.

min čitanja

Više

Tehnologija

Mercuryjev novi vanbrodski motor od 6 KS cilja na rekreativce bez dozvole

Model s EFI sustavom debitirao u La Rochelleu, nudi snažan okretni moment i jednostavno održavanje

min čitanja

Više

Tehnologija

Poziv Tesle umornim vozačima na korištenje Full Self-Drivinga izazvao polemike

Tvrtka se našla na meti kritika jer navodno potiče umorne vozače da uključe FSD, iako sam priručnik priznaje da vozila nisu potpuno autonomna.

min čitanja

Više

Tehnologija

Meta nudi jeftiniji Facebook i Instagram bez oglasa u Ujedinjenom Kraljevstvu

Nakon dogovora s britanskim regulatorom, Meta uvodi povoljniju pretplatu bez oglasa, dok u EU-u i dalje traje regulatorni pritisak zbog modela „plati ili pristani”.

min čitanja

Više

Tehnologija

Napredni sustav Varian TrueBeam skraćuje terapiju raka u Zaboku

U Zabočku bolnicu stigao Varian TrueBeam: zračenje tumora skraćeno s nekoliko tjedana na tek pet ili čak jedan tretman.

min čitanja

Više

Tehnologija

Striktnija pravila za power bankove u avionima zbunjuju putnike

Što smijete, a što nikako ne smijete činiti s prijenosnim punjačima prije ukrcaja u avion

min čitanja

Više

Tehnologija

Prvi uspjeh u liječenju Huntingtonove bolesti: genska terapija usporila napredovanje za 75 posto

Prvi rezultati londonskog tima pokazuju da je napredovanje Huntingtonove bolesti moguće usporiti za čak 75 posto jednom dozom genske terapije.

min čitanja

Više

Tehnologija

Databricks tvrdi da nova metoda smanjuje trošak rada LLM-a do 90 puta

Tehnika GEPA unutar Agent Bricks platforme automatski prilagođava upite i donosi velike uštede, dok nova suradnja s OpenAI nudi izravni pristup GPT-5 modelu.

min čitanja

Više

Tehnologija

27. rujna 2025, 06:10

Alibaba predstavio Agentic CPT, novi okvir za treniranje jezičnih modela

Novi otvoreni okvir Agentic CPT iz Alibabaova Tongyi Laba donosi agentičku fazu treniranja velikih jezičnih modela i postavlja nova mjerila performansi među open-source sustavima.

min. čitanja

Ključna dva načela

Izvorni skupovi podataka moraju biti široki i međudomenski.
Podaci moraju obuhvatiti raznolik spektar agentičkih ponašanja, kako bi model istraživao različite strateške puteve umjesto da napamet pamti rješenja.

#alibaba #tongyi-lab #agentic-cpt #agentfounder #browsecomp

Slično

Tehnologija

Odašiljač Milinac donosi signal Boroviku i okolnim selima

Dugoočekivana gradnja 48-metarskog stupa riješit će višegodišnji problem nedostatka mobilne i internetske veze u Breznici Đakovačkoj, Milincu, Paučju i na jezeru Borovik.

min čitanja

Više

Tehnologija

Robotaksiji kucaju na europska vrata: Njemačka započinje 2026., Zagreb čeka Verne

Europa se sprema za veliku premijeru autonomnih vozila: Uber i Lyft kreću u Njemačkoj 2026., dok Zagreb čeka Rimčev Verne.

min čitanja

Više

Tehnologija

Digitalni identitet u EU: dok Britanija raspravlja, Europa već živi s e-osobnim iskaznicama

Dok Ujedinjeno Kraljevstvo tek raspravlja o osobnim iskaznicama, u Europskoj uniji fizičke i digitalne verzije već su svakodnevica, a do 2026. svaki će građanin dobiti svoj digitalni identitet.

min čitanja

Više

Tehnologija

Mercuryjev novi vanbrodski motor od 6 KS cilja na rekreativce bez dozvole

Model s EFI sustavom debitirao u La Rochelleu, nudi snažan okretni moment i jednostavno održavanje

min čitanja

Više

Tehnologija

Poziv Tesle umornim vozačima na korištenje Full Self-Drivinga izazvao polemike

Tvrtka se našla na meti kritika jer navodno potiče umorne vozače da uključe FSD, iako sam priručnik priznaje da vozila nisu potpuno autonomna.

min čitanja

Više

Tehnologija

Meta nudi jeftiniji Facebook i Instagram bez oglasa u Ujedinjenom Kraljevstvu

Nakon dogovora s britanskim regulatorom, Meta uvodi povoljniju pretplatu bez oglasa, dok u EU-u i dalje traje regulatorni pritisak zbog modela „plati ili pristani”.

min čitanja

Više

Tehnologija

Napredni sustav Varian TrueBeam skraćuje terapiju raka u Zaboku

U Zabočku bolnicu stigao Varian TrueBeam: zračenje tumora skraćeno s nekoliko tjedana na tek pet ili čak jedan tretman.

min čitanja

Više

Tehnologija

Striktnija pravila za power bankove u avionima zbunjuju putnike

Što smijete, a što nikako ne smijete činiti s prijenosnim punjačima prije ukrcaja u avion

min čitanja

Više

Tehnologija

Prvi uspjeh u liječenju Huntingtonove bolesti: genska terapija usporila napredovanje za 75 posto

Prvi rezultati londonskog tima pokazuju da je napredovanje Huntingtonove bolesti moguće usporiti za čak 75 posto jednom dozom genske terapije.

min čitanja

Više

Tehnologija

Databricks tvrdi da nova metoda smanjuje trošak rada LLM-a do 90 puta

Tehnika GEPA unutar Agent Bricks platforme automatski prilagođava upite i donosi velike uštede, dok nova suradnja s OpenAI nudi izravni pristup GPT-5 modelu.

min čitanja

Više