Meta je predstavila V-JEPA 2, novu generaciju svog video modela koji robotima omogućuje rukovanje predmetima u okruženjima koja nikada prije nisu vidjeli.
V-JEPA 2 počiva na konceptu „modela svijeta” – interne simulacije fizikalnih pravila koja stroju daju sposobnost razumjeti što se u sceni događa, predvidjeti kako će se promijeniti te isplanirati niz radnji do zadanog cilja.
Dvije faze učenja
- Samonadzirano promatranje – model je gledao više od milijun sati nenaslovljenih internetskih videa i iz njih stekao temeljnu „fizičku intuiciju”.
- Fino podešavanje radnjama – dodatnih 62 sata snimki robota, uz pripadajuće upravljačke komande, spojilo je opaženo i izvedeno te omogućilo planiranje pokreta u stvarnom svijetu.
Rezultat je mogućnost tzv. nultog pokušaja (zero-shot) planiranja: robot se postavi u nepoznato okruženje, dobije sliku željenog ishoda i bez dodatne obuke sam pronalazi put do cilja. U pick-and-place zadacima uspješnost se kretala između 65 % i 80 % čak i s nepoznatim predmetima.
Što V-JEPA 2 razlikuje od drugih modela
• 1,2 milijarde parametara – višestruko manje od golemih generativnih sustava, pa radi na jednom vrhunskom GPU-u. • Predviđa apstraktne značajke (položaj, putanju), a ne svaku pojedinu boju piksela, čime smanjuje računsko opterećenje. • Jednom istreniran, može se prenijeti na različite robote bez skupljanja novih tisuća uzoraka.
Meta ističe da je „naša dugoročna vizija da modeli svijeta omoguće AI agentima planirati i rezonirati u fizičkom svijetu”. Tvrtka je objavila izvorni kod i model kako bi „izgradila široku zajednicu oko tog istraživanja” te ubrzala put prema „naprednoj strojnoj inteligenciji (AMI)”.
Poslovni učinci
• U logistici i proizvodnji roboti postaju prilagodljivi promjenama proizvoda i rasporeda skladišta bez skupog reprogramiranja. • Digitalni blizanci pogonjeni istim modelom mogu vjerno simulirati procese, predviđati kvarove i trenirati druge AI sustave. • Manji troškovi obuke otvaraju prostor za brže iteracije, bolju redundantnost i rad bez odgode, jer se kontrola može izvršavati na rubnim uređajima, a ne u oblaku.
V-JEPA 2 tako približava robotiku softverskom principu „istreniraj jednom, primijeni bilo gdje”, koji je već postao standard u računalnim oblačnim sustavima.