Tehnologija

4. studenog 2025, 20:38

Startup Manifest AI tvrdi da je probio ograničenja transformera modelom Brumby-14B

Manifest AI predstavio je Brumby-14B, model koji zamjenjuje pažnju rekurentnim slojem „power retention” i dostiže performanse transformera uz desetostruko manji trošak.

min. čitanja

Mala tvrtka Manifest AI iznenadila je svijet umjetne inteligencije objavom modela Brumby-14B-Base, prvog velikog jezikalnog modela koji potpuno odbacuje mehanizam pažnje. Umjesto toga koristi vlastitu arhitekturu „power retention”, rekurentni sloj koji, prema navodima autora, čuva informacije kroz beskonačno dugačak kontekst uz konstantan trošak po tokenu.

Što je power retention?

Klasični transformeri za svaki token računaju matrice Q, K i V te rade potpornu usporedbu svih tokena, što kod duljih nizova eksponencijalno povećava troškove memorije i izračuna. Power retention zadržava iste ulaze, ali ih umjesto globalne usporedbe ugrađuje u latentno stanje S koje se ažurira pri svakom koraku, slično RNN-ovima. Time se, tvrde u Manifestu, zadržava izražajna snaga pažnje, ali uz linearnu – pa čak i konstantnu – računalnu složenost.

14 milijardi parametara za 4 000 dolara

Brumby je nastao prepravkom otvorenog transformera Qwen3-14B-Base. Izvorni slojevi pažnje zamijenjeni su retention-om, zbog čega su postojeće težine „zaboravile” dio znanja. Model je zato naknadno dotreniran samo 3 000 koraka – oko 60 sati rada na 32 GPU-a Nvidia H100 – što je, prema računu Manifesta, koštalo približno 4 000 USD.

Osnivač tvrtke Jacob Buckman naglašava da je niska cijena moguća upravo zato što se naslanja na već istrenirane transformere: „Brumby se od nule ne bi mogao istrenirati za taj iznos.” Unatoč tome, smatra da postupak pokazuje kako „sustavi bez pažnje mogu dostići performanse transformera uz višestruko manja ulaganja”.

Rezultati i hardverske dobitke

• Paritet s Qwen3-14B i GLM-4.5-Air na većini mjerila razumijevanja teksta.
• Blago slabiji na zadacima enciklopedijskog znanja, ali bolji u matematičkom i dugokontekstnom rezoniranju.
• Interni CUDA/Triton kernel postiže 80–85 % iskorištenosti hardvera i, prema Buckmanu, „stotinu puta ubrzava” rad na vrlo dugim nizovima u odnosu na FlashAttention2.

Tvrtka predviđa da bi model sa 700 milijardi parametara mogao biti prilagođen retention-u za 10 000–20 000 USD, čime bi se masovna eksperimentiranja spustila na razinu dostupnu i manjim istraživačkim timovima.

Reakcije zajednice

Objava je izazvala raspravu na X-u: dio istraživača ocijenio je slogan „model temelja za 4 000 USD” zavaravajućim jer ne uključuje trošak izvorne obuke Qwen-a. Buckman je uzvratio da je cijela nit jasno objasnila metodu te zaključio: „Kraj ere transformera još nije stigao, ali marš je započeo.”

#nvidia #qwen #manifest-ai #brumby #jacob-buckman

View post on X

Slično

Tehnologija

Snowflake na BUILD-u 2025 najavio platformu koja ruši silose podataka

Na godišnjoj konferenciji BUILD 2025 Snowflake je predstavio platformu Snowflake Intelligence i novi modul Agentic Document Analytics, ciljajući na ukidanje podatakačnih silosa u korporativnoj AI analitici.

min čitanja

Više

Tehnologija

Biotehnološki startup Dren Bio osvojio američku nagradu Prix Galien 2025

Dren Bio proglašen najboljim startupom u SAD-u na dodjeli nagrada Prix Galien 2025 za inovativne terapije protiv raka i autoimunih bolesti.

min čitanja

Više

Tehnologija

Istraživači tržišta grle AI, ali nepovjerenje prema točnosti i dalje traje

Gotovo svi istraživači tržišta koriste AI i osjete ubrzanje rada, ali četiri od deset ispitanika prijavljuje pogreške i nove rizike, pokazuju podaci QuestDIY-a.

min čitanja

Više

Tehnologija

Databricksov „Judge Builder” rješava „ouroboros” problem ocjenjivanja umjetne inteligencije

Databricks predstavio poboljšani AI sustav „Judge Builder” koji ocjenjuje rad drugih modela i pomaže tvrtkama da konačno izmjere kvalitetu umjetne inteligencije.

min čitanja

Više

Tehnologija

Zendeskova agentička umjetna inteligencija rješava 80 % upita i predviđa probleme prije nego nastanu

Zendesk integrirao ChatGPT-5 i platformu HyperArc kako bi autonomni AI agenti rješavali većinu korisničkih upita, smanjili eskalacije i pretvorili podršku u izvor prediktivnih poslovnih uvida.

min čitanja

Više

Tehnologija

Istarski gradovi uče kako umjetna inteligencija može preobraziti javne usluge

U Puli je krenula cjelodnevna radionica na kojoj lokalni čelnici i komunalna poduzeća uče kako umjetna inteligencija može ubrzati i poboljšati javne usluge.

min čitanja

Više

Tehnologija

Sunflower Labs dobio odobrenje FAA-a za BVLOS i osigurao 16 milijuna dolara ulaganja

Američki Sunflower Labs dobio je federalno odobrenje za letove dronova izvan vidnog polja te prikupio 16 milijuna dolara za ubrzani razvoj i globalno širenje autonomnog sustava nadzora Beehive.

min čitanja

Više

Tehnologija

Tim Crni kos ponovno briljira na riječkom hackatonu

Tim Crni kos osvojio je hackaton „Lov na usluge”, razvivši igru koja mladima otkriva brojne gradske usluge.

min čitanja

Više

Tehnologija

Kako pojačati privatnost na iPhoneu: pet ključnih postavki koje vrijedi odmah promijeniti

Najnoviji iOS 26 donosi detaljne alate za zaštitu podataka, ali mnogi su skriveni. Evo kako ih pronaći i uključiti.

min čitanja

Više

Tehnologija

Što doista mijenja baterije za električne aute: pet tehnologija pred vratima i tri koje još čekaju

Analiza otkriva koje baterijske inovacije uskoro stižu u serijske električne automobile, a koje će još godinama ostati tek prototipovi.

min čitanja

Više

Tehnologija

4. studenog 2025, 20:38

Startup Manifest AI tvrdi da je probio ograničenja transformera modelom Brumby-14B

Manifest AI predstavio je Brumby-14B, model koji zamjenjuje pažnju rekurentnim slojem „power retention” i dostiže performanse transformera uz desetostruko manji trošak.

min. čitanja

Što je power retention?

14 milijardi parametara za 4 000 dolara

Rezultati i hardverske dobitke

Reakcije zajednice

#nvidia #qwen #manifest-ai #brumby #jacob-buckman

View post on X

Slično

Tehnologija

Snowflake na BUILD-u 2025 najavio platformu koja ruši silose podataka

min čitanja

Više

Tehnologija

Biotehnološki startup Dren Bio osvojio američku nagradu Prix Galien 2025

Dren Bio proglašen najboljim startupom u SAD-u na dodjeli nagrada Prix Galien 2025 za inovativne terapije protiv raka i autoimunih bolesti.

min čitanja

Više

Tehnologija

Istraživači tržišta grle AI, ali nepovjerenje prema točnosti i dalje traje

Gotovo svi istraživači tržišta koriste AI i osjete ubrzanje rada, ali četiri od deset ispitanika prijavljuje pogreške i nove rizike, pokazuju podaci QuestDIY-a.

min čitanja

Više

Tehnologija

Databricksov „Judge Builder” rješava „ouroboros” problem ocjenjivanja umjetne inteligencije

Databricks predstavio poboljšani AI sustav „Judge Builder” koji ocjenjuje rad drugih modela i pomaže tvrtkama da konačno izmjere kvalitetu umjetne inteligencije.

min čitanja

Više

Tehnologija

Zendeskova agentička umjetna inteligencija rješava 80 % upita i predviđa probleme prije nego nastanu

Zendesk integrirao ChatGPT-5 i platformu HyperArc kako bi autonomni AI agenti rješavali većinu korisničkih upita, smanjili eskalacije i pretvorili podršku u izvor prediktivnih poslovnih uvida.

min čitanja

Više

Tehnologija

Istarski gradovi uče kako umjetna inteligencija može preobraziti javne usluge

U Puli je krenula cjelodnevna radionica na kojoj lokalni čelnici i komunalna poduzeća uče kako umjetna inteligencija može ubrzati i poboljšati javne usluge.

min čitanja

Više

Tehnologija

Sunflower Labs dobio odobrenje FAA-a za BVLOS i osigurao 16 milijuna dolara ulaganja

Američki Sunflower Labs dobio je federalno odobrenje za letove dronova izvan vidnog polja te prikupio 16 milijuna dolara za ubrzani razvoj i globalno širenje autonomnog sustava nadzora Beehive.

min čitanja

Više

Tehnologija

Tim Crni kos ponovno briljira na riječkom hackatonu

Tim Crni kos osvojio je hackaton „Lov na usluge”, razvivši igru koja mladima otkriva brojne gradske usluge.

min čitanja

Više

Tehnologija

Kako pojačati privatnost na iPhoneu: pet ključnih postavki koje vrijedi odmah promijeniti

Najnoviji iOS 26 donosi detaljne alate za zaštitu podataka, ali mnogi su skriveni. Evo kako ih pronaći i uključiti.

min čitanja

Više

Tehnologija

Što doista mijenja baterije za električne aute: pet tehnologija pred vratima i tri koje još čekaju

Analiza otkriva koje baterijske inovacije uskoro stižu u serijske električne automobile, a koje će još godinama ostati tek prototipovi.

min čitanja

Više