Sanfranciski startup Tavus objavio je novu rundu ulaganja vrijednu 40 milijuna dolara koja će, kako tvrde osnivači, ubrzati dolazak računalstva „po mjeri čovjeka”. Ulaganje je predvodio fond CRV, uz sudjelovanje Scale Venture Partnersa, Sequoia Capitala, Y Combinatora, HubSpot Venturesa i Flex Capitala.
Glavna zvijezda najave su PAL-ovi – emocionalno inteligentni, multimodalni „AI ljudi” sposobni vidjeti, čuti, govoriti i djelovati nalik stvarnim osobama. Tvrtka tvrdi da su PAL-ovi u stanju:
• održavati stalnu video-prisutnost s uvjerljivim facijalnim izrazima; • čitati gestu, ton i emocionalni kontekst u realnom vremenu; • pamtiti prijašnje razgovore i preuzimati inicijativu, primjerice slati e-poruke ili zakazivati sastanke bez dodatnog nadzora.
„Desetljećima smo ljude prisiljavali da uče jezik strojeva. S PAL-ovima konačno učimo strojeve da razmišljaju poput ljudi”, izjavio je izvršni direktor Hassaan Raza.
Tri temeljna modela
Kako bi ostvario takvu razinu realističnosti, Tavus je internim istraživanjem razvio tri ključna modela:
• Phoenix-4 za izradu vjerodostojnih pokreta glave i mimike; • Sparrow-1 za zvučno razumijevanje, raspored govora i prilagodbu tonu; • Raven-1 za tumačenje konteksta, prostora, emocija i gesta.
Modeli rade u paru s memorijskim i orkestracijskim sustavom koji PAL-ovima omogućuje da „pamte” i samostalno rješavaju zadatke. Tvrtka ovaj pristup opisuje kao sljedeći korak nakon tekstualnih chatbotova i grafičkih sučelja – računalstvo koje „osjeća se živo”.
Što slijedi
Tavus navodi da njegove tehnologije već koristi više od 100 000 programera i kompanija u zapošljavanju, prodaji, obrazovanju i korisničkoj podršci. Novo financiranje namijenjeno je daljnjem razvoju modela i širenju tima istraživača specijaliziranih za renderiranje, percepciju i afektivno računarstvo.