CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

4. studenog 2025, 20:38

Startup Manifest AI tvrdi da je probio ograničenja transformera modelom Brumby-14B

Manifest AI predstavio je Brumby-14B, model koji zamjenjuje pažnju rekurentnim slojem „power retention” i dostiže performanse transformera uz desetostruko manji trošak.

min. čitanja

XFacebookWhatsApp

Mala tvrtka Manifest AI iznenadila je svijet umjetne inteligencije objavom modela Brumby-14B-Base, prvog velikog jezikalnog modela koji potpuno odbacuje mehanizam pažnje. Umjesto toga koristi vlastitu arhitekturu „power retention”, rekurentni sloj koji, prema navodima autora, čuva informacije kroz beskonačno dugačak kontekst uz konstantan trošak po tokenu.

Što je power retention?

Klasični transformeri za svaki token računaju matrice Q, K i V te rade potpornu usporedbu svih tokena, što kod duljih nizova eksponencijalno povećava troškove memorije i izračuna. Power retention zadržava iste ulaze, ali ih umjesto globalne usporedbe ugrađuje u latentno stanje S koje se ažurira pri svakom koraku, slično RNN-ovima. Time se, tvrde u Manifestu, zadržava izražajna snaga pažnje, ali uz linearnu – pa čak i konstantnu – računalnu složenost.

14 milijardi parametara za 4 000 dolara

Brumby je nastao prepravkom otvorenog transformera Qwen3-14B-Base. Izvorni slojevi pažnje zamijenjeni su retention-om, zbog čega su postojeće težine „zaboravile” dio znanja. Model je zato naknadno dotreniran samo 3 000 koraka – oko 60 sati rada na 32 GPU-a Nvidia H100 – što je, prema računu Manifesta, koštalo približno 4 000 USD.

Osnivač tvrtke Jacob Buckman naglašava da je niska cijena moguća upravo zato što se naslanja na već istrenirane transformere: „Brumby se od nule ne bi mogao istrenirati za taj iznos.” Unatoč tome, smatra da postupak pokazuje kako „sustavi bez pažnje mogu dostići performanse transformera uz višestruko manja ulaganja”.

Rezultati i hardverske dobitke

• Paritet s Qwen3-14B i GLM-4.5-Air na većini mjerila razumijevanja teksta.
• Blago slabiji na zadacima enciklopedijskog znanja, ali bolji u matematičkom i dugokontekstnom rezoniranju.
• Interni CUDA/Triton kernel postiže 80–85 % iskorištenosti hardvera i, prema Buckmanu, „stotinu puta ubrzava” rad na vrlo dugim nizovima u odnosu na FlashAttention2.

Tvrtka predviđa da bi model sa 700 milijardi parametara mogao biti prilagođen retention-u za 10 000–20 000 USD, čime bi se masovna eksperimentiranja spustila na razinu dostupnu i manjim istraživačkim timovima.

Reakcije zajednice

Objava je izazvala raspravu na X-u: dio istraživača ocijenio je slogan „model temelja za 4 000 USD” zavaravajućim jer ne uključuje trošak izvorne obuke Qwen-a. Buckman je uzvratio da je cijela nit jasno objasnila metodu te zaključio: „Kraj ere transformera još nije stigao, ali marš je započeo.”

#nvidia#qwen#manifest-ai#brumby#jacob-buckman
View post on X
View post on X
View post on X
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Novi opoziv Cybertrucka: Teslinu „neuništivom” pick-upu prijeti ispadanje kotača
Tesla opoziva još 173 Cybertrucka jer pogrešna mast može uzrokovati pucanje kočionih diskova i otpadanje kotača, što je već jedanaesta greška na kontroverznom električnom pick-upu.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja
Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”
Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej
Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku
Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi
Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete
Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja
Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Supetarska gradonačelnica o napadu na Vukovića: prijetnje ne smiju postati normalne
Gradonačelnica Supetra osudila je fizički napad na novinara Sinišu Vukovića na splitskoj Rivi i pozvala građane da prijavljuju sve prijetnje.

min čitanja

Više

Politika

Plenković u Novoj Gradiški: HDZ-ovi kandidati nude stabilnost i razvoj
Premijer Andrej Plenković u Novoj Gradiški podržao HDZ-ove kandidate Bernardina Trnku i Brunu Bušića, naglasivši nužnost stabilnog vodstva i nastavka razvojnih projekata.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana
KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Kvarner u Zagrebu protiv Cibone lovi posljednji vlak za doigravanje

Sport

Vrhunac drame u Trećoj NL Istok: Marsonia vreba povratak na vrh

Sport

Klapa HRM-a „Sveti Juraj” pjesmom podiže moral Vatrenima

Vijesti

Dvostruka akcija HGSS-a Split: isti dan spašene dvije ozlijeđene turistkinje

Sport

Riječki boksač Ramljak u polufinalu državnog prvenstva

Politika

Ivošević optužio Šutu: grad ignorira napade na novinare

Vijesti

Skele oko Tuđmanova spomenika: redovito održavanje traje do 15. svibnja

Vijesti

Ronioci najavili čišćenje podmorja uz Sustipan povodom blagdana sv. Duje

Sport

Đakovo Croatia pod pritiskom: derbi začelja protiv Hrvatskog dragovoljca odlučuje sezonu

Sport

Rijeka glatko slavila u Vukovaru i vratila treće mjesto pred finale Kupa

Lifestyle

Renata Lovrinčević Buljan usred Sudamje demonstrirala hitnu „rehabilitaciju”