CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

15. listopada 2025, 06:36

EAGLET donosi veliki skok u izdržljivosti AI agenata

Novo akademsko rješenje EAGLET podiže uspješnost i skraćuje izvršenje dugotrajnih zadataka AI agenata, a to potvrđuju i rezultati na trima zahtjevnim mjerilima.

min. čitanja

XFacebookWhatsApp

Godina 2025. već je prozvana „godinom AI agenata”, no i najsnažniji sustavi umjetne inteligencije još se muče s dugotrajnim, višekorakom zadacima. Novo akademsko rješenje, nazvano EAGLET, predlaže kako zadržati agenta „na zadatku” – bez dodatnoga ručnog označavanja podataka ili ponovnoga treniranja osnovnog modela.

Kako radi EAGLET

EAGLET su razvili istraživači s Tsinghua sveučilišta, Pekinškog sveučilišta, DeepLang AI-ja i Sveučilišta Illinois u Urbana-Champaignu. Riječ je o odvojenom „globalnom planeru” koji:

  1. prima korisničke upute,
  2. generira visoko-razinsku strategiju,
  3. prepusti izvršavanje postojećem LLM-agentu,
  4. više ne intervenira tijekom izvršenja.

Ovakva podjela rada smanjuje planerske halucinacije i skraćuje put do cilja.

Trening bez ljudskih anotacija

Planer se uči dvostupanjskim postupkom:

• Prvo se sintetski planovi stvaraju pomoću vrhunskih modela poput GPT-5 i DeepSeek-V3.1-Think. • Zatim se primjenjuje homologous consensus filtering – ostaju samo planovi koji istodobno pomažu i „iskusnim” i „početničkim” agentima.

Nakon filtriranja slijedi pojačano učenje utemeljeno na pravilima, pri čemu se svaka strategija vrednuje novom metrikom Executor Capability Gain Reward (ECGR). Ta nagrada favorizira kratke, učinkovite putanje koje podižu uspješnost različito jakih modela.

Rezultati na trima zahtjevnim mjerilima

Na benchmark-skupovima ScienceWorld, ALFWorld i WebShop agenti opremljeni EAGLET-om redovito su nadmašili:

• vlastite verzije bez planera, • konkurentske planerske pristupe poput MPO-a i KnowAgenta.

Primjeri skokova izvedbe:

• Llama-3.1-8B-Instruct: prosjek s 39,5 na 59,4 bodova (+19,9). • ScienceWorld (neviđeni scenariji): 42,2 → 61,6. • ALFWorld (viđeni scenariji): 22,9 → 54,3 – više nego dvostruko poboljšanje. • GPT-4.1: 75,5 → 82,2; GPT-5: 84,5 → 88,1.

Osim što su točniji, agenti s EAGLET-om završavali su zadatke u prosječno dva koraka manje (npr. GPT-5: s 11,4 na 9,4).

Učinkovitije treniranje i manji trošak izvođenja

Za razliku od metoda temeljenih na dubokom pojačanom učenju, koje traže stotine iteracija, EAGLET postiže jednake ili bolje rezultate uz otprilike osminu truda. Manji broj koraka tijekom izvođenja dodatno smanjuje vrijeme inferencije i trošak obrade.

Otvorena pitanja

Iako je opisan kao „plug-and-play”, izvorni kod još nije javno objavljen, pa ostaje nepoznato kako će se EAGLET uklopiti u popularne okvire poput LangChaina ili AutoGena. Također nije jasno kolika je minimalna veličina modela za praktičnu primjenu ni koliko je složena replikacija dvoagentnog treninga u tvrtkama s ograničenim resursima.

Unatoč tomu, studija pokazuje da odvojeno, globalno planiranje značajno povećava pouzdanost i učinkovitost LLM agenata, što EAGLET stavlja u središte interesa svih koji razvijaju dugotrajne AI radne procese.

#sveuciliste-illinois#tsinghua-sveuciliste#pekinsko-sveuciliste#deeplang-ai#scienceworld

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Massachusetts najavljuje zakon koji bi proizvođače prisilio da otkriju datum „smrti” pametnih uređaja
Prijedlog zakona u Massachusettsu zahtijevao bi da proizvođači pametnih uređaja unaprijed otkriju do kad će trajati softverska podrška, čime se potrošače želi zaštititi od iznenadne neupotrebljivosti i kibernetičkih prijetnji.

min čitanja

Više

Tehnologija

Nova era glasovnih sučelja: brži od ljudske percepcije i sposobni za emocije
Inworld, Nvidia, Qwen i Google DeepMind u tjedan dana uklonili su kašnjenje, riješili prekidanje, smanjili potrošnju podataka i dodali emocionalnu inteligenciju glasovnim asistentima.

min čitanja

Više

Tehnologija

Švedska briše AI hit s ljestvica: „Jacub” s 6 milijuna streamova ostaje bez službenog plasmana
IFPI Sweden izbacio je viralni singl virtualnog izvođača Jacuba sa službene ljestvice, tvrdeći da je previše generiran umjetnom inteligencijom.

min čitanja

Više

Tehnologija

Fiksne kamere brzinu mjere unutar 100 metara, ne „hvataju” kilometar daleko
Stacionarne kamere GATSO RT4, najčešće postavljene uz hrvatske prometnice, precizno mjere brzinu vozila na udaljenosti do 100 metara, a priče o „hvatanju” s nekoliko stotina metara pokazale su se neutemeljenima.

min čitanja

Više

Tehnologija

Znanstvenici upozoravaju: AI „roj“ lažnih profila prijeti demokraciji
Studija u časopisu Science najavljuje „AI rojeve“ – samostalne mreže lažnih profila sposobne masovno mijenjati javno mnijenje i ugroziti izbore.

min čitanja

Više

Tehnologija

Kineski MemRL donosi pamćenje LLM agentima bez skupog treniranja
MemRL uvodi epizodno pamćenje i Q-vrijednosti u rad velikih jezičnih modela, omogućujući im da se prilagođavaju novim zadacima bez ponovnog treniranja i pritom nadmaše klasične RAG sustave.

min čitanja

Više

Tehnologija

Silicijska dolina bruji o Claude Codeu
Novi alat za pisanje koda Claude Code dobiva pohvale tehničke zajednice i najavljuje zaokret u poslovnom modelu tvrtke Anthropic.

min čitanja

Više

Tehnologija

Salesforce: povjerenje je ključ za skok od 327 % u primjeni AI agenata
Istraživanje Salesforcea otkriva da rukovoditelji planiraju porast od 327 % u korištenju AI agenata, no uspjeh ovisi o povjerenju u podatke i sigurnost.

min čitanja

Više

Tehnologija

Railway prikupio 100 milijuna dolara za ubrzanje oblaka u doba umjetne inteligencije
Sanfranciski startup zatvorio je rundu serije B tešku 100 milijuna dolara kako bi ubrzao isporuku aplikacija i snizio troškove u svijetu koji sve više pokreće umjetna inteligencija.

min čitanja

Više

Tehnologija

Plugin Humanizer okreće Wikipedia-ina pravila protiv otkrivanja AI-teksta
Otvoreni dodatak Humanizer uči Claude kako izbjeći fraze zbog kojih AI tekst lako bude otkriven, koristeći smjernice koje je izradio WikiProject AI Cleanup.

min čitanja

Više

Najčitanije

Politika

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Zelenskij u Davosu: „Rusi moraju na kompromis” dok Abu Dhabi dočekuje prve trojne pregovore
Trojni sigurnosni razgovori SAD-a, Ukrajine i Rusije počinju u Abu Dhabiju, uz žestoke napade na ukrajinske gradove i financijsko olakšanje od agencije S&P.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524President Of Ukraine from Україна, CC0, via Wikimedia Commons

min čitanja

Više

Vaterpolo

Barakude posustale protiv Španjolske, Europsko prvenstvo zaključile na šestom mjestu
Hrvatska reprezentacija poražena 9:17 od Španjolske u dvoboju za peto mjesto na Europskom prvenstvu u Beogradu.

min čitanja

Više

Nogomet

Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542

Dinamo otvorio FCSB furioznim dvostrukim udarcem
Bakrar i Beljo zabili su u razmaku od četiri minute i Dinamo poveli 2:0 protiv FCSB-a u 7. kolu Europa lige.

min čitanja

Više

Rukomet

Danska srušila Francusku i vratila nade za polufinale
Danci su u Herningu slavili 32-29 nad Francuzima i ponovno se uključili u borbu za polufinale Europskog prvenstva u rukometu.

min čitanja

Više

Najnovije

Politika

Bruxelles nakon „grenlandske“ krize: EU hvali jedinstvo, a već gura nove trgovinske sporazume

Politika

Lopar otvara vrata mladima: POS stanovi do 2 104 eura po kvadratu

Lifestyle

Taylor Swift ulazi u Kuću slavnih kantautora

Lifestyle

Slovenski hit-triler „Jezero” stigao na hrvatske police

Vijesti

Ličko-senjska županija već priprema 28. izdanje manifestacije Jesen u Lici

Sport

Sportske lektire stigle i u dječju bolnicu: Riječki sportski savez spojio knjigu i loptu

Sport

HNS usmjerio 100.000 eura na istok: najviše dobili Kuća nogometa i NK Radnik

Vijesti

Kvar na grijanju ispraznio vrtić u Brgudu: djeca privremeno u Matuljima

Vijesti

Vozač Čazmatransa optužen za napastovanje putnice u Zagrebu

Politika

Španjolska odbila Trumpov „Odbor za mir”

Lifestyle

Osijek se pridružuje Danu mimoza: edukacijom i cvijetom protiv raka vrata maternice