San-franciski startup Nous Research objavio je otvoreni model umjetne inteligencije Nomos 1 koji je na ovogodišnjem William Lowell Putnam Mathematical Competitionu postigao rezultat kakvim se mogu pohvaliti samo najbolji studenti matematike.
Uspjeh na razini ljudske elite Putnam, najuglednije i najzahtjevnije sveučilišno natjecanje iz matematike u Sjedinjenim Državama i Kanadi, sastoji se od 12 zadataka po 10 bodova. Iako je maksimalni mogući rezultat 120, ovogodišnji pobjednik sakupio je 90 bodova, a medijan je iznosio svega 2 boda. Nomos 1 prikupio je čak 87 bodova, što bi ga smjestilo na drugo mjesto među 3 988 natjecatelja.
„This score would rank #2/3988 in 2024 and marks our first step with Hillclimb AI towards creating a SOTA AI mathematician”, priopćili su iz Nous Researcha, naglasivši da je model ostvario osam savršeno riješenih zadataka.
Kompaktna arhitektura, snažna optimizacija Za razliku od gigantskih modela s milijardama aktivnih parametara, Nomos 1 pokreće 30-milijardni sustav sa samo oko 3 milijarde aktivnih parametara zahvaljujući „mixture-of-experts” pristupu temeljenom na Qwen3 modelu. Kada je ista bazna verzija Qwen3-30B-A3B-Thinking-2507 pokrenuta bez dodatnih prilagodbi, osvojila je tek 24 boda. Iz startupa poručuju da razliku „uglavnom čine post-trening i kvaliteta podataka, a ne sam testni okvir”.
Prilagođeni „reasoning harness” Ključ uspjeha je otvoreni okvir za rezoniranje koji usmjerava model kroz rješavanje zadataka u dvije faze, unutar troipolsatnog ograničenja koje oponaša strukturu pravog natjecanja. Sustav je razvijen u suradnji s tvrtkom Hillclimb AI.
Neovisna provjera rezultata Rješenja su anonimno pregledana od strane stručnjaka koji je ranije završio među 200 najboljih na Putnamu. Nakon ocjenjivanja, Nous Research je objavio deanonimizirane datoteke i popratne upute na GitHubu.
Natjecanje koje slomi većinu Prošle je godine gotovo 4 000 studenata sudjelovalo na Putnamu, a čak 61 % njih osvojilo je tri boda ili manje. Među bivšim Putnamovim stipendistima nalaze se trojica dobitnika Fieldsove medalje i dvojica Nobelovaca iz fizike, što dodatno ističe značaj uspjeha Nomosa 1.
Objavom otvorenog koda i impresivnog rezultata, Nous Research pojačava utrku za izgradnju AI sustava sposobnih za vrhunsko matematičko rezoniranje – i pritom pokazuje da sirova veličina modela nije jedini put prema izvrsnosti.