Google DeepMind predstavio je Nano Banana Pro, službeno nazvan Gemini 3 Pro Image, i odmah potaknuo lavinu reakcija u razvojnoj zajednici. Jedan je inženjer model opisao riječima „absolutely bonkers”, a niz ranih testova sugerira da bi ova inačica mogla zadati nove kriterije u poslovnoj primjeni generativne grafike.
Model se od prethodnih iteracija razlikuje po jasnom fokusu na strukturirane radne procese: visoka razlučivost (do 4K), precizno renderiranje tipografije, mogućnost zadržavanja izgleda pri lokalizaciji sadržaja te real-time provjera činjenica. Google ga je odmah usidrio u cijeli svoj ekosustav – od Gemini API-ja i Vertex AI-a do Workspacea, Google A-dsa i razvojne platforme Antigravity.
Ključne mogućnosti
• Generiranje dijagrama, UX prototipova i storyboarda iz teksta, uz obradu do 14 ulaznih slika.
• Konzistentan izgled kroz sve kadrove – važan za tehničku dokumentaciju i edukativne materijale.
• Multijezična preciznost i ugrađeno prevođenje teksta unutar slika, što omogućuje, primjerice, jedan prompt za više tržišta.
• SynthID vodeni žig na svakoj kreiranoj slici, nevidljiv oku, ali prepoznatljiv Googleovim alatima za provjeru podrijetla.
Benchmark rezultati
Neovisna mjerenja (GenAI-Bench) svrstala su Gemini 3 Pro Image na vrh u ukupnoj korisničkoj preferenciji, kvaliteti slike i posebno u izradi infografika, nadmašivši konkurente poput GPT-Image 1 i prethodnu Googleovu verziju Gemini 2.5 Flash.
Cijene prilagođene rezoluciji
• Ulazna slika: 0,067 USD po slici (560 tokena)
• Izlaz 1K/2K: 0,134 USD (1 120 tokena)
• Izlaz 4K: 0,24 USD (2 000 tokena)
Tekstualni tokeni naplaćuju se po 2,00 USD za milijun ulaznih i 12,00 USD za milijun izlaznih tokena – identično Gemini 3 Pro LLM-u. Besplatni sloj ne uključuje Nano Banana Pro, a Google naglašava da se plaćene generacije ne koriste za dodatnu obuku modela.
Reakcije korisnika
• Dizajner Travis Davids nakon jednopoteznog menija s besprijekornim rasporedom zaključio je: „Long generated text is officially solved.”
• Imunolog dr. Derya Unutmaz nazvao medicinski prikaz CAR-T terapije „perfect”.
• Inženjer Deedy Das opisao mogućnosti uređivanja riječima: „By far the best image model I've ever seen.”
• I dok su memeri slavili „novi stroj za memeove”, istraživač Lisan al Gaib otkrio je da model i dalje „halucinira” rješenja u logičkim zadacima poput sudokua – podsjetnik da vizualno rezoniranje još nije nepogrešivo.
Širi značaj
Funkcijom SynthID, dubokom integracijom u poslovne alate i naglaskom na konzistentnost, Google svoj najnoviji model predstavlja kao „primitiv” platforme – osnovni gradivni blok budućih AI rješenja. U utrci s OpenAI-jem i drugim rivalima, Nano Banana Pro poručuje da se era generativnog AI-a sve više gleda, a ne samo čita.