Novoosnovani CraftStory, tvrtka koju vodi veterán računalnog vida Victor Erukhimov, izašla je iz faze tajnosti i predstavila Model 2.0 – sustav umjetne inteligencije sposoban stvoriti koherentne, ljudski usmjerene videozapise u trajanju do pet minuta.
Zašto je to važno • Aktualni vodeći sustavi, poput Sore i Vea, zaustavljaju se na 25, odnosno desetak sekundi, što je mnogim poduzećima nedovoljno za edukativne ili marketinške materijale. • CraftStory rješava upravo problem trajanja te tvrdi da pri tome zadržava vizualnu dosljednost i sinkronizaciju govora.
Kako funkcionira Model 2.0 počiva na paraleliziranoj difuzijskoj arhitekturi. Umjesto da video gradi sekvencijalno, sustav simultano pokreće više manjih difuzijskih procesa povezanih dvosmjernim ograničenjima: „Kasniji dio videa može utjecati na raniji i obrnuto – to sprječava nagomilavanje artefakata”, objasnio je Erukhimov.
Vlastita baza podataka Umjesto internetskih isječaka, tvrtka je snimila vlastiti materijal s glumcima i kamerama visokog broja sličica u sekundi, čime je izbjegnuta zamućenost kadra i osigurana preciznost pokreta prstiju i mimike.
Trenutačne mogućnosti • video-u-video: korisnik učita fotografiju i „vozni” video čije pokrete AI replicira; • 30-sekundni isječak u niskoj rezoluciji nastaje za otprilike 15 minuta; • napredno usklađivanje usana i geste koje prate ritam i emociju govora.
U planu je tekst-u-video generiranje te podrška za kamere u pokretu, primjerice popularni „walk-and-talk”.
Poslovni model i financije CraftStory je osigurao 2 milijuna dolara, mahom od poduzetnika Andrewa Fileva, koji vjeruje da mala, usredotočena ekipa može konkurirati znatno većim proračunima velikih laboratorija. On tvrdi da model omogućuje velikoj i maloj tvrtki da „u nekoliko minuta izrade sadržaj koji bi prije koštao 20 000 dolara i trajao dva mjeseca”.
Kome je namijenjen Tvrtka cilja korporativno tržište – treninge, prezentacije proizvoda i korisničke tutoriale koji traju dulje od kratkih reklamnih isječaka. „Ako trebate video od nekoliko minuta, dođite k nama”, poručuje Erukhimov.
Konkurencija i tržišni smjer Iako se utrka u AI videu zahuktava, CraftStory se pozicionira u niši dugog, konzistentnog i ljudima usmjerenog sadržaja, dok „veliki” razvijaju opće namjene. Filev uspoređuje situaciju: „Ako su oni motori, mi gradimo produkcijski pogon na vrhu.”
Model 2.0 dostupan je putem internetske aplikacije, a zainteresirana poduzeća već mogu zatražiti rani pristup.