Google DeepMind ostvario je povijesni iskorak: njihov napredni sustav Gemini Deep Think postao je prvi umjetno-inteligentni model koji je službeno dosegnuo zlatnu razinu na Međunarodnoj matematičkoj olimpijadi (IMO).
U standardnom vremenskom okviru od 4,5 sata model je riješio pet od šest iznimno zahtjevnih zadataka iz algebre, kombinatorike, geometrije i teorije brojeva, osvojivši 35 od mogućih 42 boda – rezultat koji premašuje prag za zlatnu medalju koju inače osvoji tek oko 8 % ljudi-natjecatelja.
„Official results are in — Gemini achieved gold-medal level in the International Mathematical Olympiad!”, objavio je izvršni direktor DeepMinda Demis Hassabis na platformi X, naglašavajući da je model „proizveo rigorozne dokaze izravno iz službenih opisa zadataka”.
Ključni pomak donijela je strategija „paralelnog razmišljanja” – umjesto jednog lanca zaključivanja, Gemini Deep Think istodobno istražuje više putova prije nego što donese konačno rješenje. Za razliku od prošlogodišnjeg Alphaproof-Alphageometry sustava, kojemu su ljudi morali prevesti zadatke u specijalizirani jezik, nova verzija djeluje potpuno u prirodnom jeziku.
Predsjednik IMO-a Gregor Dolinar opisao je rješenja kao „astonishing in many respects” te ih pohvalio zbog jasnoće i preciznosti. Time je potvrđeno da umjetna inteligencija može dosegnuti razinu logičkog rasuđivanja kakvu natjecanje dosad gotovo isključivo povezivalo s ljudskim genijalcima.
Uspjeh dolazi u trenutku sve žešće utrke tehnoloških divova. Dok se Google hvali provjerljivim rezultatima, OpenAI je na meti kritika zbog netransparentnog pristupa sličnim pokušajima. Paralelno, Muskova tvrtka xAI lansirala je Grok 4, ali prema javno dostupnim ljestvicama još kaska za Googleom i OpenAI-jem.
DeepMind je sustav trenirao naprednim metodama potkrepljujućeg učenja, oslanjajući se na veliku zbirku precizno anotiranih matematičkih rješenja i specifične upute za olimpijadske zadatke. Tvrtka najavljuje da će uskoro omogućiti pristup akademskoj zajednici, a potom ga ponuditi pretplatnicima paketa Google AI Ultra, koji košta 250 američkih dolara mjesečno.
Iako olimpijadski zadaci imaju jasna pravila i jednoznačna rješenja, stručnjaci ocjenjuju da sposobnost AI-a za apstraktno zaključivanje korak bliže dovodi ideju generalne umjetne inteligencije. Iduće godine Google planira „potragu za savršenim rezultatom” – svih šest točnih zadataka.