OpenAI je u utorak globalno pustio novu verziju svog modela za generiranje slika, ChatGPT Images 2.0. Alat je dostupan svim korisnicima ChatGPT-a i Codexa, dok pretplatnici dobivaju moćniju varijantu.
Glavne novosti
• Više slika iz jednog upita – model može izraditi cijelu brošuru ili knjižicu bez dodatnih naredbi. • Ugrađeno „razumijevanje” ChatGPT-a – sustav pretražuje internet za svježe informacije i koristi dodatne korake kako bi proširio odgovor. • Produžen obuhvat znanja – najnoviji podaci datiraju do prosinca 2025. • Fleksibilni formati – od ultrapanorame 3:1 do uspravnog formata 1:3, ovisno o želji korisnika. • Poboljšano generiranje teksta u slikama – manje iskrivljenih slova i pogrešnih oznaka nego u prijašnjim verzijama.
Primjeri iz prvih testova
Autor koji je isprobao model naručio je infografiku s vremenskom prognozom za San Francisco. Rezultat je uključio točne podatke o kišnom danu i prepoznatljive crteže gradske ikonografije – od Ferry Buildinga do Transamerica Pyramida.
U drugom pokušaju zatražen je kolaž s motivima Timothéeja Chalameta namijenjen kineskim obožavateljima. Iako je slika bila vizualno dojmljiva, tekst je bio „polugibberish”, priznao je sam ChatGPT, s mješavinom kineskih, japanskih i besmislenih znakova.
Snage i slabosti
Pozitivno: • mogućnost izrade kompleksnih, višejezičnih vizuala, • preciznije crtanje i manji broj tipografskih pogrešaka na engleskom jeziku.
Negativno: • i dalje nesigurne tekstualne komponente na nekim jezicima, • kvaliteta ovisi o jeziku i složenosti zadatka.
Što slijedi
Otvorenost prema povratnim informacijama i većoj bazi korisničkih podataka mogla bi ubrzati dorade, osobito za neengleska tržišta. Za sada, ChatGPT Images 2.0 predstavlja značajan korak naprijed u vizualnom dohvatu umjetne inteligencije, ali pokazuje da univerzalna pismenost stroja još nije sasvim dosegnuta.