Nova generacija generativne umjetne inteligencije mogla bi riješiti bolnu točku korporativnih baza podataka: točno predviđanje budućih događaja bez dugotrajnog „feature engineeringa”.
Osnivač Kumo AI-ja i profesor na Sveučilištu Stanford Jure Leskovec tvrdi da je upravo to „kritično nedostajuća karika” današnjih velikih jezičnih modela. Kumo je razvio takozvani „relacijski temeljni model” (RFM) koji, po uzoru na LLM-ove, dolazi unaprijed istreniran i spreman za „zero-shot” zadatke nad struktuiranim podacima.
„Riječ je o davanju prognoze o nečemu što još nije poznato, što se još nije dogodilo”, naglašava Leskovec. „To je potpuno nova sposobnost koja danas nedostaje generativnoj AI.”
Klasični strojni algoritmi starog kova • Tvrtke i dalje za predviđanje odlaska korisnika ili otkrivanje prijevara moraju zaposliti timove podatkovnih znanstvenika. • Ti timovi tjednima ručno spajaju tablice i kreiraju značajke – proces koji Leskovec naziva „skupim uskim grlom”.
Kako RFM zaobilazi problem
- Kumo automatski pretvara svaku relacijsku bazu u graf povezanih čvorova (npr. kupci, narudžbe, proizvodi).
- Generalizirani transformer zatim primjenjuje mehanizam pozornosti na taj graf, otkrivajući obrasce preko više tablica istodobno.
Tijekom demonstracije Leskovec je upisao upit „hoće li kupac X naručiti u idućih 30 dana?”. U manje od sekunde model je vratio vjerojatnost i objasnio ključne podatke (nedavna aktivnost, izostanak kupnji i slično) – iako prije toga nije bio treniran na toj bazi.
„Prethodno istrenirani model samo usmjerite na svoje podatke i 200 milisekundi kasnije dobijete preciznu prognozu – jednako točnu kao da je data scientist radio tjednima”, kaže Leskovec. Sučelje je nalik klasičnim analitičkim alatima, čime se prediktivna analitika približava i zaposlenicima koji nisu ML stručnjaci.
Temelj za buduće AI agente Leskovec vidi RFM kao motor koji će budućim agentima unutar poduzeća omogućiti donošenje odluka na temelju internih podataka, dok će LLM-ovi ostati zaduženi za rad s tekstom. Kumo uskoro planira izdati verziju u koju će korisnici moći povezati vlastite baze, a za maksimalnu preciznost nudit će i dodatno dotreniranje modela.
Ako se obećanja potvrde, razvoj i implementacija prediktivnih modela mogli bi se skratiti s tjedana na minute – uz znatno niže troškove i veću dostupnost sofisticirane analitike širokom krugu organizacija.