Tehnologija

Gemini Deep Think donio Googleu prvo AI zlato na Međunarodnoj matematičkoj olimpijadi

Google DeepMindov sustav Gemini Deep Think riješio je pet od šest zadataka i kao prvi AI osvojio zlatnu medalju na prestižnoj olimpijadi, produbljujući utrku tehnoloških divova u razvoju sustava za složeno rezoniranje.

min čitanja

Google DeepMind ostvario je povijesni iskorak: njihov napredni sustav Gemini Deep Think postao je prvi umjetno-inteligentni model koji je službeno dosegnuo zlatnu razinu na Međunarodnoj matematičkoj olimpijadi (IMO).

U standardnom vremenskom okviru od 4,5 sata model je riješio pet od šest iznimno zahtjevnih zadataka iz algebre, kombinatorike, geometrije i teorije brojeva, osvojivši 35 od mogućih 42 boda – rezultat koji premašuje prag za zlatnu medalju koju inače osvoji tek oko 8 % ljudi-natjecatelja.

„Official results are in — Gemini achieved gold-medal level in the International Mathematical Olympiad!”, objavio je izvršni direktor DeepMinda Demis Hassabis na platformi X, naglašavajući da je model „proizveo rigorozne dokaze izravno iz službenih opisa zadataka”.

Ključni pomak donijela je strategija „paralelnog razmišljanja” – umjesto jednog lanca zaključivanja, Gemini Deep Think istodobno istražuje više putova prije nego što donese konačno rješenje. Za razliku od prošlogodišnjeg Alphaproof-Alphageometry sustava, kojemu su ljudi morali prevesti zadatke u specijalizirani jezik, nova verzija djeluje potpuno u prirodnom jeziku.

Predsjednik IMO-a Gregor Dolinar opisao je rješenja kao „astonishing in many respects” te ih pohvalio zbog jasnoće i preciznosti. Time je potvrđeno da umjetna inteligencija može dosegnuti razinu logičkog rasuđivanja kakvu natjecanje dosad gotovo isključivo povezivalo s ljudskim genijalcima.

Uspjeh dolazi u trenutku sve žešće utrke tehnoloških divova. Dok se Google hvali provjerljivim rezultatima, OpenAI je na meti kritika zbog netransparentnog pristupa sličnim pokušajima. Paralelno, Muskova tvrtka xAI lansirala je Grok 4, ali prema javno dostupnim ljestvicama još kaska za Googleom i OpenAI-jem.

DeepMind je sustav trenirao naprednim metodama potkrepljujućeg učenja, oslanjajući se na veliku zbirku precizno anotiranih matematičkih rješenja i specifične upute za olimpijadske zadatke. Tvrtka najavljuje da će uskoro omogućiti pristup akademskoj zajednici, a potom ga ponuditi pretplatnicima paketa Google AI Ultra, koji košta 250 američkih dolara mjesečno.

Iako olimpijadski zadaci imaju jasna pravila i jednoznačna rješenja, stručnjaci ocjenjuju da sposobnost AI-a za apstraktno zaključivanje korak bliže dovodi ideju generalne umjetne inteligencije. Iduće godine Google planira „potragu za savršenim rezultatom” – svih šest točnih zadataka.

View post on X
View post on X
View post on X
View post on X
View post on X

Slično

Anthropic okreće pogled prema kapitalu iz Zaljeva unatoč ‚nelagodnom osjećaju’
Interna poruka otkriva da Anthropic traži milijarde dolara ulaganja iz Ujedinjenih Arapskih Emirata i Katara, iako njezin direktor priznaje da time pomaže autoritarnim režimima.

min čitanja

Više

Meta odbila potpisati dobrovoljni EU kodeks za generativnu umjetnu inteligenciju
Meta je prva velika tvrtka koja odbija potpisati dobrovoljni EU Kodeks za generativnu umjetnu inteligenciju, tvrdeći da dokument nadilazi AI akt i stvara pravnu nesigurnost, dok Bruxelles i europarlamentarci upozoravaju na moguće posljedice.

min čitanja

Više

Bruxelles objavio smjernice za opće AI modele, mnoge europske tvrtke izuzete
Komisija je predstavila detaljna pravila za primjenu Akta o umjetnoj inteligenciji, uvela izuzeća za tvrtke koje nadograđuju tuđe modele i odgodila punu provedbu do 2025.

min čitanja

Više

OpenAI lansirao autonomni „agent mode” za ChatGPT
Nova opcija pretvara ChatGPT u autonomnog asistenta sposobnog samostalno planirati putovanja ili obavljati internetsku kupovinu, uz stroga ograničenja u osjetljivim zadacima.

min čitanja

Više

Francuski Mistral osvježava Le Chat: deep research agent i glasovni način stižu kao izazov OpenAI-ju
Mistral AI u Le Chat uvodi Deep Research funkciju i glasovni način rada, želeći se nametnuti kao europska konkurencija OpenAI-ju i Googleu.

min čitanja

Više

OpenAI predstavio ChatGPT agent: chatbot dobio vlastito virtualno računalo
OpenAI lansirao ChatGPT agent koji samostalno pretražuje web, obrađuje datoteke i izvršava zadatke, uz nove sigurnosne mjere i početnu cijenu od 200 USD mjesečno.

min čitanja

Više

Veliki AI rivali upozoravaju: prozor za nadzor strojnog razmišljanja ubrzano se zatvara
Istraživači iz OpenAI-ja, Google DeepMinda, Anthropica i Mete upozoravaju da bi unutarnji „lanci misli” naprednih AI sustava uskoro mogli postati nečitljivi, čime bi ljudi izgubili bitan alat za nadzor sigurnosti.

min čitanja

Više

Stručnjaci upozoravaju: ChatGPT nije terapeut, čuvajte svoje tajne
Rastući trend povjeravanja osobnih problema ChatGPT-ju izazvao je upozorenja stručnjaka o nedostatku empatije i opasnosti od curenja podataka.

min čitanja

Više

Meta privukla još dvoje OpenAI stručnjaka u laboratorij za superinteligenciju
Jason Wei i Hyung Won Chung, dosadašnji istraživači OpenAI-ja, prelaze u Metin laboratorij za superinteligenciju, dok tehnološki divovi nastavljaju međusobno vrtjeti milijunske ponude za vrhunske AI talente.

min čitanja

Više

Murati najavila 2 milijarde dolara ulaganja i skoro lansiranje otvorene AI platforme
Thinking Machines privukao je 2 milijarde dolara ulaganja i najavljuje prvi proizvod s velikom open source komponentom, dok OpenAI odgađa vlastiti otvoreni model.

min čitanja

Više

Ostalo

AstraZeneca najavila ulaganje od 50 milijardi dolara u SAD pod prijetnjom novih farmaceutskih carina
AstraZeneca će do 2030. uložiti 50 milijardi dolara u širenje proizvodnje u SAD-u, potaknuta prijetnjom visokih carina administracije Donalda Trumpa.

min čitanja

Više

Berlin gura zajednički plan: sve više članica EU želi protjerivati odbijene azilante u Afganistan
Njemačko protjerivanje osuđenika u Afganistan potaknulo je raspravu u EU-u o širenju takve prakse i uspostavi regionalnih „povratnih središta”.

min čitanja

Više

General Ivan Zelić: „UDBA i KOS pokušali su nas slomiti, čudo je da sam preživio”
Brigadni general Ivan Zelić, suosnivač Prve bojne 4. gardijske brigade, prisjetio se podvala UDBA-e i KOS-a te poručio da je pravo čudo što je uopće preživio početak Domovinskog rata.

min čitanja

Više

Miljenić predvodi hrvatske plivače na SP-u u Singapuru
Hrvatskih 11 plivača, predvođenih povratnikom Nikolom Miljenićem, odlazi na Svjetsko prvenstvo u Singapuru s ambicijom ponoviti i nadmašiti prošlogodišnji uspjeh štafete 4×100 m slobodno.

min čitanja

Više

Trumpova administracija objavila FBI dosjee o Kingu unatoč protivljenju obitelji
Trumpova administracija pustila je u javnost 200 000 stranica FBI-jevih nadzornih dokumenata o Martinu Lutheru Kingu Jr., premda se obitelj i aktivisti protive tajmingu i namjerama iza poteza.

min čitanja

Više

Dim iz autobusa linije 60 uznemirio putnike na Dugom Ratu
Promet Split pojasnio je da je incident na autobusu linije 60 u Dugom Ratu bio uzrokovan manjim tehničkim kvarom te da putnici nisu bili ugroženi.

min čitanja

Više

Zastupnik tuži Komisiju zbog tajnovitosti sastanka Von der Leyen i američkog potpredsjednika
MEP tuži Europsku komisiju, tvrdeći da je prikrila detalje sastanka Ursule von der Leyen s američkim potpredsjednikom JD-om Vanceom o zakonima o odgovornosti za umjetnu inteligenciju i patentima.

min čitanja

Više

Van der Poel napustio Tour zbog upale pluća
Nizozemski šampion povukao se s Toura nakon dijagnoze upale pluća, prekinuvši impresivnu seriju u žutoj majici.

min čitanja

Više

Danska traži potporu za 90 % smanjenje emisija do 2040.
Danski ministar Lars Aagaard nastoji uvjeriti EU partnere da potvrde planirano smanjenje emisija stakleničkih plinova za 90 % do 2040., koje će predstavljati na COP30 u Brazilu.

min čitanja

Više

Škotski hokejaš poginuo padom s balkona na Ibizi: hotel pod sumnjom nakon druge smrti
Devetnaestogodišnji škotski hokejaš Gary Kelly poginuo je padom s balkona hotela na Ibizi, drugom takvom smrću u istom objektu u dva tjedna.

min čitanja

Više