Inženjerski timovi nikad nisu pisali više kôda uz pomoć umjetne inteligencije, ali kada taj kôd stigne do produkcije – nastaje zid. Tradicionalni alati za nadzor aplikacija najčešće ne prate ponašanje svake funkcije, pa AI agenti nemaju dovoljno konteksta da detektiraju grešku ili ponude ispravak.
Startup Hud tvrdi da je pronašao rješenje. U srijedu je predstavio vlastiti „runtime” senzor koji se pokreće uz produkcijski kôd i automatski bilježi kako se svaka funkcija doista ponaša u stvarnom okruženju.
„Every software team building at scale faces the same fundamental challenge: building high-quality products that work well in the real world”, poručio je osnivač i direktor Roee Adler.
Kamo nestaje vrijeme inženjera
• Moshik Eilon, tehnički voditelj u Monday.com, vodi 130 inženjera i opisuje tipičan scenarij: kad stigne upozorenje o povišenoj latenciji, počinje ručno „kopanje” po logovima i nizanje alata kako bi se rekonstruiralo što se zaista dogodilo.
• Daniel Marashlian, tehnički direktor Drate, to naziva „porezom na istragu”. Prema njegovim riječima, ljudi su satima pokušavali povezati generički alarm s konkretnim vlasnikom kôda i pronaći uzrok.
Svi se slažu oko tri glavna problema: skupo prebacivanje konteksta između različitih alata, umor od stalnih alarma („ding, ding, ding”) i nedostatak podataka koje AI agenti trebaju da bi stvarno otklonili grešku.
Zašto klasični APM više ne pomaže
Alati za nadzor performansi aplikacija (APM) oslanjaju se na masovno prikupljanje logova i „spanova”. To je skupo, pa se uzimaju niski uzorci, a ključni podaci često promaknu. „If I would want to get this information from Datadog or from CoreLogix, I would just have to ingest tons of logs or tons of spans, and I would pay a lot of money”, kaže Eilon.
Marashlian dodaje da mnogi specijalizirani alati stanu na polovici puta: mogu reći da je „Servis A pao”, ali ne i zašto.
Kako funkcionira Hudov senzor
Hudov SDK ubacuje se u aplikaciju jednom linijom kôda. Senzor prati svako izvršavanje funkcije, no u normalnim uvjetima šalje samo lagane agregirane podatke. Kad se dogodi pogreška ili usporavanje, automatski hvata dubinske forenzičke podatke – od HTTP parametara do SQL upita i cijelog konteksta izvođenja.
Platforma podatke isporučuje na četiri kanala:
- internetsko sučelje za centralni pregled,
- proširenja za IDE-ove (VS Code, JetBrains, Cursor) koja prikazuju metrike na mjestu gdje se kôd piše,
- MCP poslužitelj koji strukturirane podatke šalje AI agentima,
- sustav alerta koji prepoznaje probleme bez ručnog podešavanja.
„I can just ask Cursor a question: Hey, why is this endpoint slow? … Then I can also find the root cause”, opisuje Eilon novu praksu – umjesto višesatnog „bušenja” kroz slojeve APM-a, inženjer pita agenta i odmah dobije podatke o problematici na razini funkcije.
Rezultat: od „voodoo” incidenata do popravka u minutama
Prije su „tajanstveni” skokovi CPU-a uzimali sate ili dane. Sada se, kaže Eilon, rješavaju „tako brzo” jer je kontekst odmah dostupan. U Drati je ručna istraga pala s tri sata dnevno na desetak minuta, a prosječno vrijeme rješenja incidenta skraćeno je za oko 70 %. Podrška generira dnevni „Heads Up” popis brzih ispravaka koje developeri odrađuju u nekoliko minuta, bez opterećenja iskusnijih kolega.
Što to znači za poduzeća
Organizacije koje već koriste AI asistente poput Copilota ili Cursora dobivaju dodatni sloj sigurnosti: agentsko istraživanje umjesto ručnog preskakanja između alata. „With AI-generated code, we are getting much more AI-generated code, and engineers start not knowing all of the code”, priznaje Eilon.
Hudov senzor taj jaz premošćuje vraćajući kontekst produkcije izravno u IDE. Poduzeća koja žele skalirati AI generiranje kôda morat će procijeniti može li njihov postojeći „observability” sloj jeftino ponuditi istu razinu granularnosti. Ako su za vidljivost na razini funkcije potrebni veći troškovi ingestije ili mukotrpna instrumentacija, „runtime” senzori mogli bi postati održivija arhitektura u eri AI-ubrzanog razvoja.