CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

15. listopada 2025, 06:36

EAGLET donosi veliki skok u izdržljivosti AI agenata

Novo akademsko rješenje EAGLET podiže uspješnost i skraćuje izvršenje dugotrajnih zadataka AI agenata, a to potvrđuju i rezultati na trima zahtjevnim mjerilima.

min. čitanja

XFacebookWhatsApp

Godina 2025. već je prozvana „godinom AI agenata”, no i najsnažniji sustavi umjetne inteligencije još se muče s dugotrajnim, višekorakom zadacima. Novo akademsko rješenje, nazvano EAGLET, predlaže kako zadržati agenta „na zadatku” – bez dodatnoga ručnog označavanja podataka ili ponovnoga treniranja osnovnog modela.

Kako radi EAGLET

EAGLET su razvili istraživači s Tsinghua sveučilišta, Pekinškog sveučilišta, DeepLang AI-ja i Sveučilišta Illinois u Urbana-Champaignu. Riječ je o odvojenom „globalnom planeru” koji:

  1. prima korisničke upute,
  2. generira visoko-razinsku strategiju,
  3. prepusti izvršavanje postojećem LLM-agentu,
  4. više ne intervenira tijekom izvršenja.

Ovakva podjela rada smanjuje planerske halucinacije i skraćuje put do cilja.

Trening bez ljudskih anotacija

Planer se uči dvostupanjskim postupkom:

• Prvo se sintetski planovi stvaraju pomoću vrhunskih modela poput GPT-5 i DeepSeek-V3.1-Think. • Zatim se primjenjuje homologous consensus filtering – ostaju samo planovi koji istodobno pomažu i „iskusnim” i „početničkim” agentima.

Nakon filtriranja slijedi pojačano učenje utemeljeno na pravilima, pri čemu se svaka strategija vrednuje novom metrikom Executor Capability Gain Reward (ECGR). Ta nagrada favorizira kratke, učinkovite putanje koje podižu uspješnost različito jakih modela.

Rezultati na trima zahtjevnim mjerilima

Na benchmark-skupovima ScienceWorld, ALFWorld i WebShop agenti opremljeni EAGLET-om redovito su nadmašili:

• vlastite verzije bez planera, • konkurentske planerske pristupe poput MPO-a i KnowAgenta.

Primjeri skokova izvedbe:

• Llama-3.1-8B-Instruct: prosjek s 39,5 na 59,4 bodova (+19,9). • ScienceWorld (neviđeni scenariji): 42,2 → 61,6. • ALFWorld (viđeni scenariji): 22,9 → 54,3 – više nego dvostruko poboljšanje. • GPT-4.1: 75,5 → 82,2; GPT-5: 84,5 → 88,1.

Osim što su točniji, agenti s EAGLET-om završavali su zadatke u prosječno dva koraka manje (npr. GPT-5: s 11,4 na 9,4).

Učinkovitije treniranje i manji trošak izvođenja

Za razliku od metoda temeljenih na dubokom pojačanom učenju, koje traže stotine iteracija, EAGLET postiže jednake ili bolje rezultate uz otprilike osminu truda. Manji broj koraka tijekom izvođenja dodatno smanjuje vrijeme inferencije i trošak obrade.

Otvorena pitanja

Iako je opisan kao „plug-and-play”, izvorni kod još nije javno objavljen, pa ostaje nepoznato kako će se EAGLET uklopiti u popularne okvire poput LangChaina ili AutoGena. Također nije jasno kolika je minimalna veličina modela za praktičnu primjenu ni koliko je složena replikacija dvoagentnog treninga u tvrtkama s ograničenim resursima.

Unatoč tomu, studija pokazuje da odvojeno, globalno planiranje značajno povećava pouzdanost i učinkovitost LLM agenata, što EAGLET stavlja u središte interesa svih koji razvijaju dugotrajne AI radne procese.

#sveuciliste-illinois#tsinghua-sveuciliste#pekinsko-sveuciliste#deeplang-ai#scienceworld
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Kibernetički napad oborio Canvas i poremetio nastavu tisućama škola
Masovni pad platforme Canvas zbog napada grupe "ShinyHunters" poremetio je nastavu diljem SAD-a, a hakeri prijete objavom podataka više od 8 800 škola.

min čitanja

Više

Tehnologija

Kako ukloniti Gemini Nano iz Chromea i što time gubite
Googleov AI model Gemini Nano potajno zauzima 4 GB na računalima korisnika Chromea. Donosimo upute kako ga isključiti i koje sigurnosne značajke tada prestaju raditi.

min čitanja

Više

Tehnologija

Zašto par jeftinih žičanih slušalica vrijedi imati u putnoj torbi
Sezona putovanja vraća u fokus staru tehnologiju: evo zašto bi svatko trebao ubaciti jeftine žičane slušalice u prtljagu.

min čitanja

Više

Tehnologija

Apple u Velikoj Britaniji uvodi obveznu provjeru dobi na iPhoneu
Nakon ažuriranja iOS-a 26.4 Apple od britanskih korisnika traži dokaz da su stariji od 18 godina; u suprotnom iPhone automatski prelazi u dječji režim s ograničenim pristupom sadržaju.

min čitanja

Više

Tehnologija

Čudni verbalni tikovi ChatGPT-a sve više iritiraju kineske korisnike
Kineski korisnici sve češće kritiziraju ChatGPT zbog neprirodnih fraza koje se uporno ponavljaju u njegovim odgovorima.

min čitanja

Više

Tehnologija

Lunar Outpost osigurao 30 milijuna dolara za brži razvoj novog lunarnog vozila
Startup iz Colorada fokus preusmjerava s većeg rovera Eaglea na brže izvedivi Pegasus kako bi zadovoljio ubrzane NASA-ine rokove unutar programa Artemis.

min čitanja

Više

Tehnologija

Splićanin od 16 godina aplikacijom „Dajen ti rič” prozvao grad i zabavio građane
Viralna aplikacija „Dajen ti rič” šesnaestogodišnjaka Tome Solde pretvorila je satiru u konkretan alat za prijavu komunalnih problema u Splitu.

min čitanja

Više

Tehnologija

Umjetna inteligencija i nosivi senzori mijenjaju rano otkrivanje dijabetesa
Algoritmi na temelju CGM-a, EKG-a i genetskih pokazatelja obećavaju milijunima ranije upozorenje na dijabetes.

min čitanja

Više

Tehnologija

Poreč najavljuje predavanje o poticajima za kućne solarne elektrane
Sunčani ured Grada Poreča i Zelena energetska zadruga 13. svibnja organiziraju besplatno predavanje o državnim poticajima za kućne solarne elektrane, baterije i dizalice topline.

min čitanja

Više

Tehnologija

Fitbit postaje Google Health, a Google Fit odlazi u povijest
Google je potvrdio da će popularna aplikacija Fitbit uskoro postati Google Health, dok će Google Fit biti ugašen do kraja godine.

min čitanja

Više

Najčitanije

Vijesti

SAD i Iran razmijenili udare: gađane luke Kešm i Bandar Abbas, Teheran optužuje za kršenje primirja
Novi udari na Perzijskom zaljevu: američki avioni pogodili iranske luke i raketna postrojenja, Iran uzvratio vatrom i tvrdi da je pogođen njegov tanker.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Lifestyle

Željko Bebek s novim singlom „Voli me do neba”

Sport

Grobničan se vratio u Prvu ligu i već sanja Superligu

Biznis

Lidl ponovno izaziva pomamu: Parksideova kolica za stepenice rasprodaju se munjevito

Politika

Farageov Reform UK potopio laburiste na britanskim lokalnim izborima

Vijesti

Vrane na Knežiji izazvale strah i raspravu među susjedima

Politika

Smrti s odgodom za bivše kineske ministre obrane Wei Fenghea i Li Shangfua

Biznis

Porezna diže rampu: 40 lokala zapečaćeno, povrat poreza stiže do kraja svibnja

Politika

Orešković podsjetila na Dan oslobođenja Zagreba: „Hvala partizanima i svima budnima”

Vijesti

Dobrovoljci pozvani na čišćenje uvale Šeničina 10. svibnja

Vijesti

Zagreb obilježava Dan oslobođenja: vijenci na Mirogoju i Dotrščini, svečana akademija u Lisinskom

Vijesti

Policija na Peščenici otkrila laboratorij za preprodaju „droge za silovanje”