CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

4. studenog 2025, 20:38

Startup Manifest AI tvrdi da je probio ograničenja transformera modelom Brumby-14B

Manifest AI predstavio je Brumby-14B, model koji zamjenjuje pažnju rekurentnim slojem „power retention” i dostiže performanse transformera uz desetostruko manji trošak.

min. čitanja

XFacebookWhatsApp

Mala tvrtka Manifest AI iznenadila je svijet umjetne inteligencije objavom modela Brumby-14B-Base, prvog velikog jezikalnog modela koji potpuno odbacuje mehanizam pažnje. Umjesto toga koristi vlastitu arhitekturu „power retention”, rekurentni sloj koji, prema navodima autora, čuva informacije kroz beskonačno dugačak kontekst uz konstantan trošak po tokenu.

Što je power retention?

Klasični transformeri za svaki token računaju matrice Q, K i V te rade potpornu usporedbu svih tokena, što kod duljih nizova eksponencijalno povećava troškove memorije i izračuna. Power retention zadržava iste ulaze, ali ih umjesto globalne usporedbe ugrađuje u latentno stanje S koje se ažurira pri svakom koraku, slično RNN-ovima. Time se, tvrde u Manifestu, zadržava izražajna snaga pažnje, ali uz linearnu – pa čak i konstantnu – računalnu složenost.

14 milijardi parametara za 4 000 dolara

Brumby je nastao prepravkom otvorenog transformera Qwen3-14B-Base. Izvorni slojevi pažnje zamijenjeni su retention-om, zbog čega su postojeće težine „zaboravile” dio znanja. Model je zato naknadno dotreniran samo 3 000 koraka – oko 60 sati rada na 32 GPU-a Nvidia H100 – što je, prema računu Manifesta, koštalo približno 4 000 USD.

Osnivač tvrtke Jacob Buckman naglašava da je niska cijena moguća upravo zato što se naslanja na već istrenirane transformere: „Brumby se od nule ne bi mogao istrenirati za taj iznos.” Unatoč tome, smatra da postupak pokazuje kako „sustavi bez pažnje mogu dostići performanse transformera uz višestruko manja ulaganja”.

Rezultati i hardverske dobitke

• Paritet s Qwen3-14B i GLM-4.5-Air na većini mjerila razumijevanja teksta.
• Blago slabiji na zadacima enciklopedijskog znanja, ali bolji u matematičkom i dugokontekstnom rezoniranju.
• Interni CUDA/Triton kernel postiže 80–85 % iskorištenosti hardvera i, prema Buckmanu, „stotinu puta ubrzava” rad na vrlo dugim nizovima u odnosu na FlashAttention2.

Tvrtka predviđa da bi model sa 700 milijardi parametara mogao biti prilagođen retention-u za 10 000–20 000 USD, čime bi se masovna eksperimentiranja spustila na razinu dostupnu i manjim istraživačkim timovima.

Reakcije zajednice

Objava je izazvala raspravu na X-u: dio istraživača ocijenio je slogan „model temelja za 4 000 USD” zavaravajućim jer ne uključuje trošak izvorne obuke Qwen-a. Buckman je uzvratio da je cijela nit jasno objasnila metodu te zaključio: „Kraj ere transformera još nije stigao, ali marš je započeo.”

#nvidia#qwen#manifest-ai#brumby#jacob-buckman
View post on X
View post on X
View post on X

Slično

Tehnologija

Tvrtke otkrivaju novu bolnu točku umjetne inteligencije: brzina i kapacitet, a ne cijena
Primjeri Wondera i Recursiona pokazuju da trošak više nije najveća prepreka pri uvođenju umjetne inteligencije; ključni izazovi postaju latencija, fleksibilnost i kapacitet infrastrukture.

min čitanja

Više

Tehnologija

NYU predstavio RAE: nova arhitektura drastično ubrzava difuzijske modele
Nova metoda „representation autoencoders” ubrzava treniranje difuzijskih modela 47 puta i poboljšava kvalitetu generiranih slika.

min čitanja

Više

Tehnologija

Terminal-Bench 2.0 i Harbor donose strože testiranje autonomnih AI agenata
Novi benchmark i okvir za kontejnere podižu ljestvicu u testiranju sposobnosti AI agenata u terminalskim okruženjima.

min čitanja

Više

Tehnologija

Privremena regulacija prometa u Ulici Castropola zbog polaganja optičkih kablova
Pulska Ulica Castropola u ponedjeljak postaje gradilište: polaganje optičkih kablova za FTTH mrežu donosi privremene promjene u prometu, ali i brži internet za 8 600 korisnika.

min čitanja

Više

Tehnologija

Mexico City pod strogim okom 83.000 kamera, a stiže ih još 30.000
Grad s već 83.414 javnih kamera ulaže 345 milijuna pezosa u dodatnih 30.400 uređaja, s ciljem jačanja nadzora i borbe protiv kriminala.

min čitanja

Više

Tehnologija

Europol traži bržu proceduru za korištenje umjetne inteligencije u hitnim istragama
Birokratske provjere usporavaju policijsku primjenu AI-a, dok kriminalci već profitiraju od nove tehnologije, upozorava zamjenik direktora Europola.

min čitanja

Više

Tehnologija

Techno-žarište na sjeveru SAD-a: kako su Minneapolis i St. Paul postali magnet za poslovne putnike
Metropola od 3,76 milijuna stanovnika nudi spoj bogate računalne povijesti, snažne start-up scene i duha „work-life balansa” koji ljeti seli urede na jezera, a zimi u grijane skywaye.

min čitanja

Više

Tehnologija

Renault otkrio električni Twingo: retro šarm uz domet od 260 km
Francuski proizvođač predstavio je tehničke specifikacije retro-modernog električnog Twinga, čiji motor od 60 kW i baterija od 27,5 kWh obećavaju 260 km dosega i cijenu nižu od 20 000 eura.

min čitanja

Više

Tehnologija

Google predstavlja File Search i pojednostavljuje RAG za tvrtke
Novi alat unutar Gemini API-ja automatizira skladištenje, uparivanje i pretraživanje dokumenata, smanjujući troškove i složenost implementacije.

min čitanja

Više

Tehnologija

Volkswagen u savezu s Horizon Roboticsom razvija čip za autonomnu vožnju u Kini
Volkswagen i Horizon Robotics osnivaju CARIZON i kreću u razvoj naprednog čipa za autonomna vozila namijenjenog kineskom tržištu.

min čitanja

Više

Najčitanije

Politika

Sloboda govora između Washingtona i Bruxellesa: tko povlači crtu?
Američko-europski prijepor o granicama slobode govora zaoštrio se nakon povratka Donalda Trumpa u Bijelu kuću. Dok Washington optužuje Bruxelles za cenzuru, unutar EU-a bujaju napetosti između pozivanja na slobodu izražavanja i borbe protiv govora mržnje.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Politika

Srbija ukida zaštitu bombardiranog Generalštaba radi Kushnerova luksuznog projekta
Skupština Srbije posebnim zakonom omogućila rušenje zaštićene zgrade Generalštaba i 500 milijuna dolara vrijedan projekt zeta Donalda Trumpa, uz optužbe za korupciju i falsifikate.

min čitanja

Više

Najnovije

Lifestyle

Edukacijski koncerti napunili riječko kazalište: više od 1.300 mladih upoznalo čari klasične glazbe

Politika

Televizijski okršaj Goldsteina i Vukića: povjesničar žali zbog „kapitulacije” pred revizionizmom

Sport

Hajduk na Poljudu lovi novo slavlje, Lokomotiva protiv Slavena traži priključak

Lifestyle

Bez srdele do ponedjeljka: riječkom ribarnicom vladali brancin, orada i škamp

Biznis

Manje novca, više plakata: novi natječaj Autotroleja izazvao lavinu pitanja

Biznis

Rijeka bilježi dvoznamenkasti rast jesenskih dolazaka, hoteli sve traženiji

Sport

Dinamo preračunava potencijalni otkaz Kovačeviću: otpremnina bi skočila na 240.000 eura

Vijesti

Tornado poharao jug Brazila: pet mrtvih, više od 130 ozlijeđenih

Sport

Riječani žele ekspresnu pobjedu protiv Siska i bijeg s dna ljestvice

Sport

Rukometni vikend: NEXE brani savršeni niz u Sesvetama, Osijek i Spačva love ključne bodove

Biznis

Slavonsko tržište nekretnina traži zamah: malo novogradnje, sve više posrednika