Kad je Google u studenome predstavio svoj model za generiranje slika Nano Banana Pro (službeno Gemini 3 Pro Image), podigao je ljestvicu za cijelu industriju: po prvi put bilo je moguće običnim tekstom zatražiti infografike, prezentacijske slajdove ili druge vizuale krcate pisanim sadržajem – i sve to bez pravopisnih pogrešaka.
No skok naprijed došao je uz poznatu cijenu. Googleov model ostaje čvrsto vezan uz vlastiti cloud, naplaćuje se premium tarifama i ne ostavlja puno prostora za lokalno hostiranje ili prilagodbu regionalnim propisima.
Qwen-Image-2512, najnoviji uradak istraživačkog tima Qwen iz Alibabe, sada nudi drukčiji odgovor. Model je objavljen sredinom prosinca, besplatan je za razvoj i komercijalnu uporabu pod licencom Apache 2.0, a cjelokupna težina modela već je dostupna na platformama Hugging Face i ModelScope te na GitHubu.
Ključne novosti • Vjerodostojniji ljudi i okruženja – lica preciznije prikazuju dob i teksturu, poze se vjernije drže zadanog opisa, a pozadine dobivaju jasniji kontekst. • Fina struktura materijala – voda, krzno i pejzaži prikazuju se s glađim prijelazima, pa je manje naknadnog retuširanja za e-commerce, edukaciju ili vizualizacije. • Točan tekst i uredan raspored – natpisi na posterima, slajdovima i infografikama čitljivi su na kineskom i engleskom, područje u kojem su otvoreni modeli dosad najviše zaostajali za komercijalnim rješenjima.
Prema slijepim, ljudski ocjenjivanim testovima na internom poligonu AI Arena, Qwen-Image-2512 trenutačno je najjači otvoreni model za slike i drži korak s najzatvorenijim konkurentima.
Zašto je otvorenost bitna Dostupan pod liberalnom licencom, Qwen-Image-2512 tvrtkama donosi: • Kontrolu troškova – umjesto neprestanih API-naknada, moguće je samostalno hostiranje i amortizacija infrastrukture; • Suverenitet nad podacima – ključno za regulirane industrije koje zahtijevaju potpunu kontrolu zapisnika i lokacije pohrane; • Lokalizaciju – model se može prilagoditi jezicima, kulturnim normama ili internim stilskim priručnicima bez čekanja na dobavljača.
Ipak, za one koji preferiraju gotovu uslugu, Alibaba Cloud nudi isti model pod imenom qwen-image-max kroz Model Studio API po cijeni od 0,075 USD po generiranoj slici, uz ograničene besplatne kvote.
Drugačija filozofija od Googlea Googleov Nano Banana Pro briljira u spoju s Vertex AI-jem, Workspaceom i ostalim proizvodima unutar iste infrastrukture, što je privlačno korisnicima već duboko ukorijenjenima u Google Cloud. Qwen-Image-2512 pak igra na modularnost: lako se ugrađuje u otvorene orkestracijske sustave i vlastite podatkovne tokove.
Širi signal industriji Objava Qwen-Image-2512 jasno poručuje kako otvoreni svijet više ne pristaje na ulogu drugog reda. Ključne značajke za poslovnu primjenu – vjernost tekstu, kontrolirani layout i realističan prikaz – sada dolaze bez zatvorenih vrata i visokih tarifa. Google je podignuo strop, a Alibaba pokazuje da se do njega može stići i s otvorenim kodom, uz veću slobodu izbora za korisnike.