CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

4. studenog 2025, 20:38

Startup Manifest AI tvrdi da je probio ograničenja transformera modelom Brumby-14B

Manifest AI predstavio je Brumby-14B, model koji zamjenjuje pažnju rekurentnim slojem „power retention” i dostiže performanse transformera uz desetostruko manji trošak.

min. čitanja

XFacebookWhatsApp

Mala tvrtka Manifest AI iznenadila je svijet umjetne inteligencije objavom modela Brumby-14B-Base, prvog velikog jezikalnog modela koji potpuno odbacuje mehanizam pažnje. Umjesto toga koristi vlastitu arhitekturu „power retention”, rekurentni sloj koji, prema navodima autora, čuva informacije kroz beskonačno dugačak kontekst uz konstantan trošak po tokenu.

Što je power retention?

Klasični transformeri za svaki token računaju matrice Q, K i V te rade potpornu usporedbu svih tokena, što kod duljih nizova eksponencijalno povećava troškove memorije i izračuna. Power retention zadržava iste ulaze, ali ih umjesto globalne usporedbe ugrađuje u latentno stanje S koje se ažurira pri svakom koraku, slično RNN-ovima. Time se, tvrde u Manifestu, zadržava izražajna snaga pažnje, ali uz linearnu – pa čak i konstantnu – računalnu složenost.

14 milijardi parametara za 4 000 dolara

Brumby je nastao prepravkom otvorenog transformera Qwen3-14B-Base. Izvorni slojevi pažnje zamijenjeni su retention-om, zbog čega su postojeće težine „zaboravile” dio znanja. Model je zato naknadno dotreniran samo 3 000 koraka – oko 60 sati rada na 32 GPU-a Nvidia H100 – što je, prema računu Manifesta, koštalo približno 4 000 USD.

Osnivač tvrtke Jacob Buckman naglašava da je niska cijena moguća upravo zato što se naslanja na već istrenirane transformere: „Brumby se od nule ne bi mogao istrenirati za taj iznos.” Unatoč tome, smatra da postupak pokazuje kako „sustavi bez pažnje mogu dostići performanse transformera uz višestruko manja ulaganja”.

Rezultati i hardverske dobitke

• Paritet s Qwen3-14B i GLM-4.5-Air na većini mjerila razumijevanja teksta.
• Blago slabiji na zadacima enciklopedijskog znanja, ali bolji u matematičkom i dugokontekstnom rezoniranju.
• Interni CUDA/Triton kernel postiže 80–85 % iskorištenosti hardvera i, prema Buckmanu, „stotinu puta ubrzava” rad na vrlo dugim nizovima u odnosu na FlashAttention2.

Tvrtka predviđa da bi model sa 700 milijardi parametara mogao biti prilagođen retention-u za 10 000–20 000 USD, čime bi se masovna eksperimentiranja spustila na razinu dostupnu i manjim istraživačkim timovima.

Reakcije zajednice

Objava je izazvala raspravu na X-u: dio istraživača ocijenio je slogan „model temelja za 4 000 USD” zavaravajućim jer ne uključuje trošak izvorne obuke Qwen-a. Buckman je uzvratio da je cijela nit jasno objasnila metodu te zaključio: „Kraj ere transformera još nije stigao, ali marš je započeo.”

#nvidia#qwen#manifest-ai#brumby#jacob-buckman
View post on X
View post on X
View post on X

Slično

Tehnologija

Snowflake na BUILD-u 2025 najavio platformu koja ruši silose podataka
Na godišnjoj konferenciji BUILD 2025 Snowflake je predstavio platformu Snowflake Intelligence i novi modul Agentic Document Analytics, ciljajući na ukidanje podatakačnih silosa u korporativnoj AI analitici.

min čitanja

Više

Tehnologija

Biotehnološki startup Dren Bio osvojio američku nagradu Prix Galien 2025
Dren Bio proglašen najboljim startupom u SAD-u na dodjeli nagrada Prix Galien 2025 za inovativne terapije protiv raka i autoimunih bolesti.

min čitanja

Više

Tehnologija

Istraživači tržišta grle AI, ali nepovjerenje prema točnosti i dalje traje
Gotovo svi istraživači tržišta koriste AI i osjete ubrzanje rada, ali četiri od deset ispitanika prijavljuje pogreške i nove rizike, pokazuju podaci QuestDIY-a.

min čitanja

Više

Tehnologija

Databricksov „Judge Builder” rješava „ouroboros” problem ocjenjivanja umjetne inteligencije
Databricks predstavio poboljšani AI sustav „Judge Builder” koji ocjenjuje rad drugih modela i pomaže tvrtkama da konačno izmjere kvalitetu umjetne inteligencije.

min čitanja

Više

Tehnologija

Zendeskova agentička umjetna inteligencija rješava 80 % upita i predviđa probleme prije nego nastanu
Zendesk integrirao ChatGPT-5 i platformu HyperArc kako bi autonomni AI agenti rješavali većinu korisničkih upita, smanjili eskalacije i pretvorili podršku u izvor prediktivnih poslovnih uvida.

min čitanja

Više

Tehnologija

Istarski gradovi uče kako umjetna inteligencija može preobraziti javne usluge
U Puli je krenula cjelodnevna radionica na kojoj lokalni čelnici i komunalna poduzeća uče kako umjetna inteligencija može ubrzati i poboljšati javne usluge.

min čitanja

Više

Tehnologija

Sunflower Labs dobio odobrenje FAA-a za BVLOS i osigurao 16 milijuna dolara ulaganja
Američki Sunflower Labs dobio je federalno odobrenje za letove dronova izvan vidnog polja te prikupio 16 milijuna dolara za ubrzani razvoj i globalno širenje autonomnog sustava nadzora Beehive.

min čitanja

Više

Tehnologija

Tim Crni kos ponovno briljira na riječkom hackatonu
Tim Crni kos osvojio je hackaton „Lov na usluge”, razvivši igru koja mladima otkriva brojne gradske usluge.

min čitanja

Više

Tehnologija

Kako pojačati privatnost na iPhoneu: pet ključnih postavki koje vrijedi odmah promijeniti
Najnoviji iOS 26 donosi detaljne alate za zaštitu podataka, ali mnogi su skriveni. Evo kako ih pronaći i uključiti.

min čitanja

Više

Tehnologija

Što doista mijenja baterije za električne aute: pet tehnologija pred vratima i tri koje još čekaju
Analiza otkriva koje baterijske inovacije uskoro stižu u serijske električne automobile, a koje će još godinama ostati tek prototipovi.

min čitanja

Više

Najčitanije

Nogomet

By http://hospitalityguide.manutd.com/global_assets/Wine_List.pdf, Fair use, https://en.wikipedia.org/w/index.php?curid=30961834

Ronaldo o završetku karijere: sprema se na suze i proziva Manchester United
Cristiano Ronaldo najavio kraj karijere, otkrio da će vjerojatno zaplakati i ponovno kritizirao stanje u Manchester Unitedu.
By Анна Нэсси - soccer.ru, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=69972366

min čitanja

Više

Nogomet

Rijeka preimenovala Rujevicu u stadion Dean Šćulac
Klub s Kvarnera odaje počast preminulom dopredsjedniku Deanu Šćulcu preimenovanjem stadiona Rujevica u njegovu čast.

min čitanja

Više

Najnovije

Politika

Ustavni sud BiH odbacio Dodikovu apelaciju, prijevremeni izbori u RS-u 23. studenoga

Vijesti

U Susedgradu zapaljena tri automobila, policija traga za počiniteljem

Biznis

Središnje banke gomilaju zlato, HNB i dalje gleda sa strane

Vijesti

Rijeka mladim obiteljima nudi stanove za 2 eura po kvadratu

Sport

Borilački svijet tuguje: preminuo kickboksački prvak Vladimir Toktasjinov

Tehnologija

Snowflake na BUILD-u 2025 najavio platformu koja ruši silose podataka

Politika

HDZ-ova dužnosnica tvrdi da su „Dani srpske kulture” u Splitu održani bez dozvole

Sport

Sky Sport Italia uručio otkaze pripravnicima zbog euforičnog slavlja pogotka Intera

Vijesti

Dojava o bombi paralizirala Reaganovu zračnu luku u Washingtonu

Tehnologija

Biotehnološki startup Dren Bio osvojio američku nagradu Prix Galien 2025