Tehnologija

29. studenog 2025, 06:25

Anthropic tvrdi da je riješio ključan problem pamćenja dugotrajnih AI agenata

Anthropic predstavlja dvodijelnu arhitekturu koja Claudeu omogućuje da kroz više sesija sačuva kontinuitet rada i tako izbjegne zaborav uputa.

min. čitanja

Startup Anthropic predstavio je novo rješenje za svoj Claude Agent SDK kako bi otklonio kroničan problem: agenti koji rade danima ili tjednima zaboravljaju upute čim prijeđu granicu vlastitog kontekstnog prozora.

„Osnovni izazov dugotrajnih agenata jest to što moraju raditi u diskretnim sesijama, a svaka nova sesija započinje bez sjećanja na prethodnu”, istaknuli su inženjeri tvrtke u blog-zapisu. Budući da većina složenih projekata premašuje ograničeni broj tokena koje model može ‘vidjeti’ odjednom, agenti moraju pronaći način da mostom povežu sesije.

Ključ Anthropicova pristupa je dvočlana arhitektura:

Initializer agent postavlja radno okruženje, bilježi sve što je prethodno napravljeno i koje su datoteke dodane.
Coding agent zatim u svakoj novoj sesiji radi male inkrementalne korake, ostavlja strukturirane upute i artefakte za sljedeći krug te uz pomoć ugrađenih testova automatski otkriva i ispravlja greške.

Tvrtka navodi da je inspiraciju pronašla u svakodnevnoj praksi softverskih inženjera: jasna podjela zadataka, verzioniranje i testiranje. Bez takve discipline, pokazuju interni testovi, čak i veliki model Opus 4.5, kad dobije samo općenitu naredbu poput „izradi klon claude.ai”, posrne na dva načina: ili pokušava napraviti previše pa ostaje bez konteksta usred posla, ili pak, nakon dijela obavljenih funkcija, samouvjereno proglasi projekt završenim.

Iako na tržištu već postoje biblioteke poput LangMem-a, Memobasea ili OpenAI-eva Swarma, Anthropic tvrdi da njihovo rješenje donosi uredniji prijenos znanja između sesija i jednostavnije se povezuje s vlastitim modelima. Tvrtka priznaje da je riječ o „tek jednom mogućem sklopu rješenja”, ali vjeruje da se naučene lekcije mogu prenijeti na širi raspon zadataka, od znanstvenih istraživanja do financijskog modeliranja.

Sljedeći korak, poručuju istraživači, bit će utvrditi isplati li se generalistički koderski agent ili je učinkovitija podjela na više specijaliziranih agenata. Za sada su rezultati obećavajući, barem u domeni full-stack web razvoja, no širu primjenu tek treba eksperimentalno potvrditi.

#openai #anthropic

Slično

Tehnologija

Stihovima do nuklearne bombe: istraživači otkrili veliku rupu u zaštiti AI sustava

Nova studija pokazuje da chatbotovi popuštaju pred opasnim zahtjevima kada su upakirani u stihove, s čak 62 % uspjeha ručno pisanih pjesama.

min čitanja

Više

Tehnologija

Laboratorijska slanina stiže u SAD: Mission Barns dobio zeleno svjetlo FDA-e

FDA je odobrila proizvodnju i prodaju svinjske masti uzgojene u laboratoriju, a startup Mission Barns najavljuje hibridnu „slaninu“ bez klanja svinja.

min čitanja

Više

Tehnologija

Bez vidljivosti nema povjerenja: promatranje pretvara LLM-ove u pouzdan korporativni alat

Telemetrija pretvara umjetnu inteligenciju iz laboratorijskog pokusa u pouzdanu infrastrukturu – primjer iz bankarskog slučaja pokazuje zašto je promatranje ključno.

min čitanja

Više

Tehnologija

AI kompanije obećavaju „čišća“ psihodelična iskustva, dok se opasni izazovi šire među mladima

Tehnološke tvrtke razvijaju AI alate i nove molekule kako bi uklonile „loše tripove“, dok se istodobno među mladima šire opasni izazovi s lijekovima.

min čitanja

Više

Tehnologija

Zadarska tvrtka Margins prednjači na Deloitteovoj listi tehnoloških brzaca

Margins vodi hrvatski poredak na Deloitteovoj listi 50 najbrže rastućih tehnoloških kompanija srednje Europe.

min čitanja

Više

Tehnologija

KBC Rijeka prvi u javnom zdravstvu uveo preciznu „radiokirurgiju nožem od zraka”

Riječki KBC prvi u Hrvatskoj uvedenjem stereotaksijske radioterapije omogućio onkološko liječenje bez čekanja i s preciznošću „virtualnog skalpela”.

min čitanja

Više

Tehnologija

Airbus povlači 6.000 zrakoplova A320 zbog softvera ranjivog na Sunce

Softverska ranjivost na solarno zračenje potaknula je Airbus na hitan opoziv i kratkotrajno prizemljenje polovice globalne flote A320.

min čitanja

Više

Tehnologija

Rusija prijeti potpunom blokadom WhatsAppa zbog nesuradnje s vlastima

Roskomnadzor najavio zabranu popularne aplikacije ako Meta ne pristane dijeliti podatke u istragama prijevara i terorizma.

min čitanja

Više

Tehnologija

Novi okvir Agent-R1 mijenja način treniranja jezičnih modela

Kineski istraživači osmislili su Agent-R1, okvir koji proširuje tradicionalno učenje potkrepljivanjem i omogućuje velikim jezičnim modelima rješavanje složenih višekoračnih zadataka u promjenjivim okruženjima.

min čitanja

Više

Tehnologija

McDonald’s proširio aplikaciju: Hranu sada možete naručiti i platiti bez čekanja

Nova Mobile Order & Pay opcija omogućuje naručivanje, plaćanje i preuzimanje McDonald’s obroka bez čekanja, uz dostavu za stol, pult, McDrive ili parkiralište.

min čitanja

Više

Tehnologija

29. studenog 2025, 06:25

Anthropic tvrdi da je riješio ključan problem pamćenja dugotrajnih AI agenata

Anthropic predstavlja dvodijelnu arhitekturu koja Claudeu omogućuje da kroz više sesija sačuva kontinuitet rada i tako izbjegne zaborav uputa.

min. čitanja

Ključ Anthropicova pristupa je dvočlana arhitektura:

Initializer agent postavlja radno okruženje, bilježi sve što je prethodno napravljeno i koje su datoteke dodane.
Coding agent zatim u svakoj novoj sesiji radi male inkrementalne korake, ostavlja strukturirane upute i artefakte za sljedeći krug te uz pomoć ugrađenih testova automatski otkriva i ispravlja greške.

#openai #anthropic

Slično

Tehnologija

Stihovima do nuklearne bombe: istraživači otkrili veliku rupu u zaštiti AI sustava

Nova studija pokazuje da chatbotovi popuštaju pred opasnim zahtjevima kada su upakirani u stihove, s čak 62 % uspjeha ručno pisanih pjesama.

min čitanja

Više

Tehnologija

Laboratorijska slanina stiže u SAD: Mission Barns dobio zeleno svjetlo FDA-e

FDA je odobrila proizvodnju i prodaju svinjske masti uzgojene u laboratoriju, a startup Mission Barns najavljuje hibridnu „slaninu“ bez klanja svinja.

min čitanja

Više

Tehnologija

Bez vidljivosti nema povjerenja: promatranje pretvara LLM-ove u pouzdan korporativni alat

Telemetrija pretvara umjetnu inteligenciju iz laboratorijskog pokusa u pouzdanu infrastrukturu – primjer iz bankarskog slučaja pokazuje zašto je promatranje ključno.

min čitanja

Više

Tehnologija

AI kompanije obećavaju „čišća“ psihodelična iskustva, dok se opasni izazovi šire među mladima

Tehnološke tvrtke razvijaju AI alate i nove molekule kako bi uklonile „loše tripove“, dok se istodobno među mladima šire opasni izazovi s lijekovima.

min čitanja

Više

Tehnologija

Zadarska tvrtka Margins prednjači na Deloitteovoj listi tehnoloških brzaca

Margins vodi hrvatski poredak na Deloitteovoj listi 50 najbrže rastućih tehnoloških kompanija srednje Europe.

min čitanja

Više

Tehnologija

KBC Rijeka prvi u javnom zdravstvu uveo preciznu „radiokirurgiju nožem od zraka”

Riječki KBC prvi u Hrvatskoj uvedenjem stereotaksijske radioterapije omogućio onkološko liječenje bez čekanja i s preciznošću „virtualnog skalpela”.

min čitanja

Više

Tehnologija

Airbus povlači 6.000 zrakoplova A320 zbog softvera ranjivog na Sunce

Softverska ranjivost na solarno zračenje potaknula je Airbus na hitan opoziv i kratkotrajno prizemljenje polovice globalne flote A320.

min čitanja

Više

Tehnologija

Rusija prijeti potpunom blokadom WhatsAppa zbog nesuradnje s vlastima

Roskomnadzor najavio zabranu popularne aplikacije ako Meta ne pristane dijeliti podatke u istragama prijevara i terorizma.

min čitanja

Više

Tehnologija

Novi okvir Agent-R1 mijenja način treniranja jezičnih modela

min čitanja

Više

Tehnologija

McDonald’s proširio aplikaciju: Hranu sada možete naručiti i platiti bez čekanja

Nova Mobile Order & Pay opcija omogućuje naručivanje, plaćanje i preuzimanje McDonald’s obroka bez čekanja, uz dostavu za stol, pult, McDrive ili parkiralište.

min čitanja

Više