Intuit, kompanija koja stoji iza alata TurboTax, QuickBooks, Credit Karma i Mailchimp, predstavila je veliku nadogradnju svog Generative AI Operating Systema (GenOS). Cilj je jasan: specijalizirati umjetnu inteligenciju za financijske procese i time nadmašiti generičke modele.
Glavne novosti
-
Vlastiti financijski LLM-ovi • Novi veliki jezični modeli, trenirani isključivo na financijskim podacima, postižu 90 % točnosti pri kategorizaciji transakcija. • Vrijeme odaziva smanjeno je za 50 % u odnosu na opće modele, što smanjuje troškove i ubrzava rad platformi koje svakog mjeseca obrađuju desetke milijuna AI-interakcija. • Modeli razumiju kontekst pa mogu prepoznati i korisnički definirane kategorije, što omogućuje visoku razinu personalizacije bez ručnog podešavanja.
-
Stručnjak „u petlji” • GenOS sada automatski prepoznaje situacije u kojima je potreban ljudski nadzor i usmjerava zadatak odgovarajućem računovođi ili savjetniku. • Takav orkestrirani pristup smanjuje rizik pogrešnih preporuka, a pritom čuva brzinu rada sustava.
-
Napredno vrednovanje agenata • Poboljšana GenOS Evaluation Service više ne mjeri samo točnost odgovora nego i učinkovitost puta kojim je agent došao do rješenja. • Sustav detektira „točne, ali besmislene” odluke – primjerice kad bi AI predložio put od San Francisca do Los Angelesa preko Oklahome – i rangira bolje, brže ili jeftinije alternative.
Zašto je to važno
• Specijalizirani podaci daju bolji rezultat od općih modela, iako zahtijevaju veću početnu investiciju. • Objektivna procjena učinkovitosti postaje nova kompetitivna prednost jer tvrtke više ne mogu računati samo na brojčanu točnost. • Infrastruktura za usklađen rad ljudi i AI-a ključna je za bilo kakvu veću implementaciju u financijskom sektoru. • Interni alati koje Intuit gradi ubrzavaju rad vlastitih razvojnih timova i multipliciraju povrat na uloženo.
Intuit poručuje da će daljnjim optimizacijama dodatno snižavati troškove i latenciju, dok će kvaliteta modela nastaviti rasti. Primjer tvrtke pokazuje da se utrka u generativnoj AI-ju sve više seli s općih jezičnih rješenja na domensko usmjerene, strogo kontrolirane sustave koji precizno rješavaju specifične poslovne probleme.