Generativna umjetna inteligencija više se ne zadržava samo u razgovornim sučeljima. Najnoviji hit u tehnološkoj zajednici, takozvani agentski sustavi, omogućuju da modeli samostalno kupuju karte, razvijaju softver, istražuju tržišne trendove ili rezerviraju putovanja – sve bez stalne ljudske kontrole.
„LLM agent izvršava alate u petlji kako bi postigao cilj”, objašnjava britanski programer Simon Willison, čije je minimalističko tumačenje postalo svojevrsna definicija fenomena. Korisnik agentu zada zadatak, primjerice rezervaciju stola u restoranu blizu kina, a agent potom planira korake, poziva potrebne alate i ponavlja postupak dok ne ispuni cilj.
Ključni dijelovi agentskog ekosustava
- Okviri za izgradnju – razvojni paketi olakšavaju programerima slaganje i pokretanje agenata bez pisanja koda od nule.
- Mjesto za rad modela – moćni jezični modeli traže specijalizirani hardver, pa većina rješenja prebiva u oblaku.
- Okruženje za agentski kod – agent mora ostati aktivan i kada korisnik ugasi računalo, što ponovno favorizira cloud infrastrukturu.
- Most prema alatima – najrašireniji standard trenutačno je Model Context Protocol (MCP) koji definira kako agent zove API-je i prima odgovore.
- Kratkoročna memorija – privremeno pohranjuje podatke nastale tijekom sesije kako bi se rasteretio model i ubrzao rad.
- Dugoročna memorija – čuva preferencije korisnika i kontekst prošlih razgovora, pa agent idući put ne mora ispočetka skupljati iste informacije.
- Praćenje i tragovi – detaljni zapisi svih koraka nužni su za nadzor troškova, brzine i točnosti, ali i za daljnje poboljšavanje sustava.
ReAct: misao, radnja, opažanje
Većina današnjih rješenja oslanja se na obrazac ReAct (reasoning + action). Agent prvo formulira misao (što napraviti), zatim izvršava radnju (API poziv ili generiranje Python koda) i na kraju bilježi opažanje (dobiveni rezultat). Ciklus se ponavlja dok zadatak ne bude obavljen.
Sigurnost i skalabilnost
Amazonov Firecracker i slične tehnologije mikroračunala (microVM) omogućuju da svaka korisnička sesija dobije zasebno izolirano okruženje. Nakon završetka rada stanje modela seli se u dugoročnu memoriju, a microVM se briše, čime se kombiniraju učinkovitost i čvrsta sigurnost.
Pristup zaštićenim resursima rješava se preko provjerenih mehanizama poput OAuth-a ili kroz poslužiteljske sesije s unaprijed definiranim ovlastima. Na taj način agent može djelovati u ime korisnika bez izlaganja lozinki.
Zašto je sve ovo važno?
Premještanjem AI-ja iz „pješčanika” chata u aplikacije koje izravno utječu na stvarni svijet, agenti pomiču granice korisnosti tehnologije. Sustavi sposobni učiti iz prijašnjih interakcija, dinamički birati alate i samostalno pisati kod najavljuju novu fazu automatizacije – onu u kojoj će softver, uz minimalne upute, obavljati složene poslove umjesto nas.