Tehnologija

22. srpnja 2025, 06:20

Gemini Deep Think donio Googleu prvo AI zlato na Međunarodnoj matematičkoj olimpijadi

Google DeepMindov sustav Gemini Deep Think riješio je pet od šest zadataka i kao prvi AI osvojio zlatnu medalju na prestižnoj olimpijadi, produbljujući utrku tehnoloških divova u razvoju sustava za složeno rezoniranje.

min. čitanja

Google DeepMind ostvario je povijesni iskorak: njihov napredni sustav Gemini Deep Think postao je prvi umjetno-inteligentni model koji je službeno dosegnuo zlatnu razinu na Međunarodnoj matematičkoj olimpijadi (IMO).

U standardnom vremenskom okviru od 4,5 sata model je riješio pet od šest iznimno zahtjevnih zadataka iz algebre, kombinatorike, geometrije i teorije brojeva, osvojivši 35 od mogućih 42 boda – rezultat koji premašuje prag za zlatnu medalju koju inače osvoji tek oko 8 % ljudi-natjecatelja.

„Official results are in — Gemini achieved gold-medal level in the International Mathematical Olympiad!”, objavio je izvršni direktor DeepMinda Demis Hassabis na platformi X, naglašavajući da je model „proizveo rigorozne dokaze izravno iz službenih opisa zadataka”.

Ključni pomak donijela je strategija „paralelnog razmišljanja” – umjesto jednog lanca zaključivanja, Gemini Deep Think istodobno istražuje više putova prije nego što donese konačno rješenje. Za razliku od prošlogodišnjeg Alphaproof-Alphageometry sustava, kojemu su ljudi morali prevesti zadatke u specijalizirani jezik, nova verzija djeluje potpuno u prirodnom jeziku.

Predsjednik IMO-a Gregor Dolinar opisao je rješenja kao „astonishing in many respects” te ih pohvalio zbog jasnoće i preciznosti. Time je potvrđeno da umjetna inteligencija može dosegnuti razinu logičkog rasuđivanja kakvu natjecanje dosad gotovo isključivo povezivalo s ljudskim genijalcima.

Uspjeh dolazi u trenutku sve žešće utrke tehnoloških divova. Dok se Google hvali provjerljivim rezultatima, OpenAI je na meti kritika zbog netransparentnog pristupa sličnim pokušajima. Paralelno, Muskova tvrtka xAI lansirala je Grok 4, ali prema javno dostupnim ljestvicama još kaska za Googleom i OpenAI-jem.

DeepMind je sustav trenirao naprednim metodama potkrepljujućeg učenja, oslanjajući se na veliku zbirku precizno anotiranih matematičkih rješenja i specifične upute za olimpijadske zadatke. Tvrtka najavljuje da će uskoro omogućiti pristup akademskoj zajednici, a potom ga ponuditi pretplatnicima paketa Google AI Ultra, koji košta 250 američkih dolara mjesečno.

Iako olimpijadski zadaci imaju jasna pravila i jednoznačna rješenja, stručnjaci ocjenjuju da sposobnost AI-a za apstraktno zaključivanje korak bliže dovodi ideju generalne umjetne inteligencije. Iduće godine Google planira „potragu za savršenim rezultatom” – svih šest točnih zadataka.

#demis-hassabis #openai #google-deepmind #medjunarodna-matematicka-olimpijada #gemini-deep-think

View post on X

Slično

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata

Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Adobe na MAX konferenciji predstavio val novih AI alata

Na MAX konferenciji u Los Angelesu Adobe je predstavio nove AI funkcije u Fireflyju, Photoshopu i Expressu te najavio Project Moonlight i integraciju s ChatGPT-om.

min čitanja

Više

Tehnologija

PayPal ubrzava dolazak „agentske trgovine” novim servisom za AI-tržnice

Novi PayPalov servis Shop Sync omogućuje da se katalozi trgovaca pojave u AI chatovima, dok Agent Ready planira izravna plaćanja od 2026. godine.

min čitanja

Više

Tehnologija

Ekonomisti upozoravaju: umjetna inteligencija ima sve simptome megabalona

Model povijesnih tehnoloških balona smješta generativni AI u najrizičniju kategoriju – razinu 8/8.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije

Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju

Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Tehnologija

Jesu li stari automobili stvarno bili bolji?

Analiza ruši mit da su stari automobili bili superiorni: današnji su brži, sigurniji i tehnološki napredniji, dok nostalgija uglavnom počiva na dizajnu i raznolikosti koje je progutala SUV revolucija.

min čitanja

Više

Tehnologija

Osijek pionir kontrastne mamografije uz potporu umjetne inteligencije

Kontrastna mamografija u Domu zdravlja Osijek postiže osjetljivost veću od 90 %, a umjetna inteligencija dodatno povećava pouzdanost nalaza.

min čitanja

Više

Tehnologija

SiLC proširuje sjedište u Monroviji i jača domaću proizvodnju fotoničkih sustava

Kalifornijski SiLC investira u širenje pogona kako bi ubrzao serijsku proizvodnju silicijskih fotoničkih čipova i vizijskih sustava za industrijsku automatizaciju i obranu.

min čitanja

Više

Tehnologija

Eon predstavio aplikaciju koja mobitel pretvara u ključ: najam električnih vozila bez čekanja

Redizajnirana Eonova aplikacija uvodi digitalni ključ, ukida šaltere i skraćuje proces najma električnih vozila na manje od minute.

min čitanja

Više

Tehnologija

22. srpnja 2025, 06:20

Gemini Deep Think donio Googleu prvo AI zlato na Međunarodnoj matematičkoj olimpijadi

min. čitanja

#demis-hassabis #openai #google-deepmind #medjunarodna-matematicka-olimpijada #gemini-deep-think

View post on X

Slično

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata

Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Adobe na MAX konferenciji predstavio val novih AI alata

Na MAX konferenciji u Los Angelesu Adobe je predstavio nove AI funkcije u Fireflyju, Photoshopu i Expressu te najavio Project Moonlight i integraciju s ChatGPT-om.

min čitanja

Više

Tehnologija

PayPal ubrzava dolazak „agentske trgovine” novim servisom za AI-tržnice

Novi PayPalov servis Shop Sync omogućuje da se katalozi trgovaca pojave u AI chatovima, dok Agent Ready planira izravna plaćanja od 2026. godine.

min čitanja

Više

Tehnologija

Ekonomisti upozoravaju: umjetna inteligencija ima sve simptome megabalona

Model povijesnih tehnoloških balona smješta generativni AI u najrizičniju kategoriju – razinu 8/8.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije

Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju

Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Tehnologija

Jesu li stari automobili stvarno bili bolji?

min čitanja

Više

Tehnologija

Osijek pionir kontrastne mamografije uz potporu umjetne inteligencije

Kontrastna mamografija u Domu zdravlja Osijek postiže osjetljivost veću od 90 %, a umjetna inteligencija dodatno povećava pouzdanost nalaza.

min čitanja

Više

Tehnologija

SiLC proširuje sjedište u Monroviji i jača domaću proizvodnju fotoničkih sustava

Kalifornijski SiLC investira u širenje pogona kako bi ubrzao serijsku proizvodnju silicijskih fotoničkih čipova i vizijskih sustava za industrijsku automatizaciju i obranu.

min čitanja

Više

Tehnologija

Eon predstavio aplikaciju koja mobitel pretvara u ključ: najam električnih vozila bez čekanja

Redizajnirana Eonova aplikacija uvodi digitalni ključ, ukida šaltere i skraćuje proces najma električnih vozila na manje od minute.

min čitanja

Više