CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

4. studenog 2025, 20:38

Startup Manifest AI tvrdi da je probio ograničenja transformera modelom Brumby-14B

Manifest AI predstavio je Brumby-14B, model koji zamjenjuje pažnju rekurentnim slojem „power retention” i dostiže performanse transformera uz desetostruko manji trošak.

min. čitanja

XFacebookWhatsApp

Mala tvrtka Manifest AI iznenadila je svijet umjetne inteligencije objavom modela Brumby-14B-Base, prvog velikog jezikalnog modela koji potpuno odbacuje mehanizam pažnje. Umjesto toga koristi vlastitu arhitekturu „power retention”, rekurentni sloj koji, prema navodima autora, čuva informacije kroz beskonačno dugačak kontekst uz konstantan trošak po tokenu.

Što je power retention?

Klasični transformeri za svaki token računaju matrice Q, K i V te rade potpornu usporedbu svih tokena, što kod duljih nizova eksponencijalno povećava troškove memorije i izračuna. Power retention zadržava iste ulaze, ali ih umjesto globalne usporedbe ugrađuje u latentno stanje S koje se ažurira pri svakom koraku, slično RNN-ovima. Time se, tvrde u Manifestu, zadržava izražajna snaga pažnje, ali uz linearnu – pa čak i konstantnu – računalnu složenost.

14 milijardi parametara za 4 000 dolara

Brumby je nastao prepravkom otvorenog transformera Qwen3-14B-Base. Izvorni slojevi pažnje zamijenjeni su retention-om, zbog čega su postojeće težine „zaboravile” dio znanja. Model je zato naknadno dotreniran samo 3 000 koraka – oko 60 sati rada na 32 GPU-a Nvidia H100 – što je, prema računu Manifesta, koštalo približno 4 000 USD.

Osnivač tvrtke Jacob Buckman naglašava da je niska cijena moguća upravo zato što se naslanja na već istrenirane transformere: „Brumby se od nule ne bi mogao istrenirati za taj iznos.” Unatoč tome, smatra da postupak pokazuje kako „sustavi bez pažnje mogu dostići performanse transformera uz višestruko manja ulaganja”.

Rezultati i hardverske dobitke

• Paritet s Qwen3-14B i GLM-4.5-Air na većini mjerila razumijevanja teksta.
• Blago slabiji na zadacima enciklopedijskog znanja, ali bolji u matematičkom i dugokontekstnom rezoniranju.
• Interni CUDA/Triton kernel postiže 80–85 % iskorištenosti hardvera i, prema Buckmanu, „stotinu puta ubrzava” rad na vrlo dugim nizovima u odnosu na FlashAttention2.

Tvrtka predviđa da bi model sa 700 milijardi parametara mogao biti prilagođen retention-u za 10 000–20 000 USD, čime bi se masovna eksperimentiranja spustila na razinu dostupnu i manjim istraživačkim timovima.

Reakcije zajednice

Objava je izazvala raspravu na X-u: dio istraživača ocijenio je slogan „model temelja za 4 000 USD” zavaravajućim jer ne uključuje trošak izvorne obuke Qwen-a. Buckman je uzvratio da je cijela nit jasno objasnila metodu te zaključio: „Kraj ere transformera još nije stigao, ali marš je započeo.”

#nvidia#qwen#manifest-ai#brumby#jacob-buckman
View post on X
View post on X
View post on X
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Finski i riječki srednjoškolci zajedno istraživali odgovornu uporabu umjetne inteligencije
U riječkoj gimnaziji održan Erasmus+ susret SustainAI: finski i hrvatski srednjoškolci raspravljali o etici, ekologiji i obrazovnom potencijalu umjetne inteligencije.

min čitanja

Više

Tehnologija

Magnetska stimulacija mozga nudi novu nadu djeci s autizmom
Istraživanje pokazalo da transkranijalna magnetska stimulacija (TMS) poboljšava kontakt očima i socijalne reakcije djece s autizmom, otvarajući put personaliziranijim terapijama.

min čitanja

Više

Tehnologija

Možemo li još vjerovati fotografiji? Predavanje Kristine Peteh u Sv. Lovreču
Predavanje u Sv. Lovreču otvara pitanja povjerenja u fotografiju u eri umjetne inteligencije i digitalnih manipulacija.

min čitanja

Više

Tehnologija

Znanstvenici predviđaju: Y kromosom polako slabi, no muškarci neće nestati
Nova analiza otkriva da Y kromosom kroz evoluciju gubi gene, ali to ne znači da će muškarci nestati.

min čitanja

Više

Tehnologija

Hrvatska kaska za EU u umjetnoj inteligenciji: manjak znanja guši konkurentnost
Samo 22 posto hrvatskih tvrtki koristi umjetnu inteligenciju, daleko ispod europskog prosjeka. Stručnjaci tvrde da su glavni kočničari manjak znanja, nedovoljna edukacija i nejasna regulativa, zbog čega država i gospodarstvo gube korak s EU-om.
By © European Union, 1998 – 2025, Attribution, https://commons.wikimedia.org/w/index.php?curid=171253370Autor Friends of Europe, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=19296961By European Union - https://newsroom.consilium.europa.eu/permalink/p218893, Public Domain, https://commons.wikimedia.org/w/index.php?curid=185538322

min čitanja

Više

Tehnologija

Lažna SMS kazna za prebrzu vožnju: prevaranti napadaju vozače diljem Hrvatske
Novi lanac poruka o navodnoj neplaćenoj prometnoj kazni širi se Hrvatskom. Lažni SMS prijeti dvostrukom globom i blokadom vozačke dozvole, a cilj mu je krađa bankovnih podataka.

min čitanja

Više

Tehnologija

Schmidhuber i Supan na Danima komunikacija: od kozmosa umjetne inteligencije do zemaljske snage jasnog brenda
Završni dan Dana komunikacija suprotstavio je vizionarsku znanost Jürgena Schmidhubera s praktičnom brend strategijom Julie Supan, naglašavajući razliku između privlačne retorike i komunikacije koja doista mijenja ponašanje.

min čitanja

Više

Tehnologija

U Splitu otvorena 3. EDIT konferencija o umjetnoj inteligenciji u obrazovanju
Treća EDIT konferencija, posvećena ulozi umjetne inteligencije u školama, okupila je više od 200 sudionika na Prirodoslovno-matematičkom fakultetu u Splitu.

min čitanja

Više

Tehnologija

Mobilni podaci otkrivaju granice eVisitora u vođenju destinacija
Znanstveni rad ističe da Hrvatskoj za održivi turizam treba nadogradnja postojećeg sustava eVisitor mobilnim podacima.

min čitanja

Više

Tehnologija

Split na četiri dana postaje globalno središte sporta, zdravlja i umjetne inteligencije
Konferencija HAIPER 2026 od 12. do 15. svibnja okuplja u Splitu svjetske stručnjake za sport, zdravlje i umjetnu inteligenciju.
By Анна Нэсси - https://www.soccer.ru/galery/1056975/photo/735567, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=71215179

min čitanja

Više

Najčitanije

Vijesti

Četiri tijela u Kupi i Mrežnici: Karlovačka policija utvrđuje identitet i uzrok smrti
U rijekama Kupi i Mrežnici nedaleko Karlovca pronađena su četiri mrtva muškarca; policija radi na identifikaciji i utvrđivanju uzroka smrti.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Lifestyle

Buket iznenađenja razgalio Marijanu Puljak za Majčin dan

Vijesti

Dio Zagreba bez struje u ponedjeljak zbog radova HEP-a

Sport

Mlade nade OFC-a blistale na Plitvicama: dva zlata i dva srebra

Sport

Arsenal ostao čvrst na vrhu zahvaljujući kasnom pogotku Trossarda

Sport

Rudeš šokirao juniore Rijeke: sedmi poraz bijelih u sezoni

Tehnologija

Finski i riječki srednjoškolci zajedno istraživali odgovornu uporabu umjetne inteligencije

Sport

Mladi jedriličari zablistali na 23. Regati Sv. Vid u riječkom akvatoriju

Lifestyle

Stipe Čogelja emotivnom objavom o majci dirnuo pratitelje

Tehnologija

Magnetska stimulacija mozga nudi novu nadu djeci s autizmom

Vijesti

Ideja zagrebačkog metroa ponovno rasplamsala raspravu

Tehnologija

Možemo li još vjerovati fotografiji? Predavanje Kristine Peteh u Sv. Lovreču