Google je lansirao Gemini 2.5 Flash Image, novitet koji tvrtkama donosi preciznije i kontroliranije AI-uređivanje fotografija unutar aplikacije Gemini. Model, poznat beta-testerima pod kodnim imenom „nanobanana”, sada je dostupan svim besplatnim i plaćenim korisnicima platforme.
„Znamo da pri uređivanju fotografija prijatelja, obitelji ili kućnih ljubimaca i najmanje nepravilnosti bodu oči – ‘skoro isto’ jednostavno nije dovoljno dobro”, poručili su u blogu voditelj multimodalne generacije Gemini Apps David Sharon i produkt-menadžerica Google DeepMinda Nicole Brichtova. Upravo zato nadogradnja jamči da lik osobe ili životinje ostane nepromijenjen, čak i kada se mijenja pozadina, dodaje šešir psu ili kombiniraju dvije slike.
Ključne novosti • konzistentnost: model zadržava prepoznatljive crte lica i tijela pri višestrukim ili složenim zahvatima. • kolaboracija: korisnici mogu u više koraka tražiti izmjene, spajati fotografije ili prenositi stil jednog kadra na drugi. • kontrola: problematične „sitne” deformacije nakon urednih zapovijedi – poput blagog pomicanja osobe – sada bi trebale biti stvar prošlosti.
Svaka slika koju generira Gemini nosit će Googleovu oznaku SynthID, a izravna integracija znači da se infografike ili fotografije mogu dorađivati bez napuštanja chat-prozora.
Spektakl na društvenim mrežama Još od sredine kolovoza korisnici LM Arene nagađali su da je tajanstveni „nanobanana” Googleov projekt, diveći se sposobnosti da „u nekoliko koraka” kombinira dvije slike ili promijeni izraz lica i vremenske uvjete. Sada je potvrđeno da je riječ upravo o Gemini 2.5 Flash Imageu.
Tržišna utrka Googleov alat stiže u vrijeme pojačanog nadmetanja: OpenAI je već ugradio izvorno uređivanje slika u ChatGPT, Qwen je pustio svoj Qwen-Image Edit, dok je Adobe Firefly duboko integriran u Photoshop. Novi Gemini odgovor je na prigovore tvrtki da AI previše mijenja fotografije pri naizgled sitnim zahtjevima – od sada bi „profesionalne Photoshop” izmjene trebale stizati u sekundama, samo na temelju teksta.
Gemini nudi uređivanje slika u chatu od ožujka, no verzija 2.5 Flash Image donosi finije miješanje stilova, spajanje kadrova i višekratno uređivanje bez gubitka identiteta subjekta. Google time želi privući poslovne korisnike koji trebaju brzu, ali vjerodostojnu vizualnu produkciju u velikom opsegu.