Kineski div Alibaba proširio je svoju liniju AI rješenja objavom Qwen-Image-Edit, otvorenog modela koji složene zahvate na fotografijama obavlja uz jednostavne tekstualne upute – od sitnog uklanjanja pramena kose do potpunog pretvaranja njujorškog pejzaža u Lego maketu.
Model je nadogradnja ranije predstavljenog 20-milijardnog Qwen-Image i preuzima njegov dvostruki sustav kodiranja: jedan kanal (Qwen2.5-VL) brine o semantičkom značenju, dok se drugi – varijacijski automatski koder – fokusira na vizualnu vjernost. Taj spoj omogućuje dvije razine zahvata:
- Semantička uređivanja – rotiranje objekata, promjenu stila u, primjerice, Studio Ghibli estetiku ili stvaranje potpuno novog intelektualnog vlasništva.
- Izgledna uređivanja – lokalne dorade poput dodavanja odraza na vodi, promjene boje pojedinog slova ili uklanjanja grafita s vjenčanog luka.
Istovremeno, Qwen-Image-Edit zadržao je reputaciju starijeg brata u preciznom renderiranju teksta na engleskom i kineskom jeziku. Korisnik tako može bez poteškoća umetnuti natpis na poster ili korigirati kanji u kaligrafiji, uz očuvanje originalnog fonta i veličine slova.
Dostupnost i cijena • Qwen Chat (ograničeno na osam besplatnih generiranja svakih 12 sati) • Hugging Face, ModelScope, GitHub (open source pod licencijom Apache 2.0) • Alibaba Cloud API – 0,045 USD po slici, prvih 100 slika besplatno u roku od 180 dana; trenutno u podatkovnom centru u Singapuru, s pet zahtjeva u sekundi i dvije paralelne obrade po korisniku.
Slike se šalju putem URL-a ili Base64 zapisa u rezoluciji od 512 do 4 096 piksela (do 10 MB). Rezultati se drže na Alibaba Cloud-u 24 sata, nakon čega ih korisnik mora preuzeti.
Potencijalne primjene • marketinški materijali s brzim prilagodbama logotipa ili slogana • proizvodnja avatara i stiliziranih ilustracija • profesionalna foto-retuširanja i osobne uspomene • digitalna restauracija kulturne baštine, uključujući rukopise
Otvoreni kod i Apache licenca čine model posebno privlačnim tvrtkama koje žele zadržati potpunu kontrolu nad podacima i troškovima, zaobilazeći skupe pretplate na softver poput Photoshopa.
Iako Qwen-Image-Edit zasad nema službene brojke na standardiziranim testovima, ekipa navodi „state-of-the-art” rezultate, a brze demonstracije – npr. dobivanje tuxeda iz običnog sakoa u tri sekunde – potvrđuju da je Adobe dobio više nego ozbiljnu konkurenciju.