CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

7. ožujka 2026, 06:13

MIT predstavio Attention Matching: nova tehnika koja 50 puta smanjuje memorijski teret velikih jezičnih modela

Nova metoda MIT-ovih istraživača pokazuje kako se radna memorija velikih jezičnih modela može smanjiti i do 50 puta, a da se pritom ne gubi kvaliteta odgovora.

min. čitanja

XFacebookWhatsApp

Veliki jezični modeli sve češće rješavaju poslovne zadatke koji zahtijevaju obradu desetaka tisuća tokena – od pravnih ugovora do višednevnih razgovora sa strankama. No kako raste duljina konteksta, linearno raste i memorija u kojoj se pohranjuju ključevi i vrijednosti (KV) svakog prethodnog tokena, što brzo iscrpljuje skupu radnu memoriju GPU-ova.

„U praksi je KV predmemorija najveće usko grlo pri posluživanju modela s iznimno dugim kontekstom”, rekao je koautor rada Adam Zweiger. Prevelika predmemorija ograničava broj istovremenih korisnika, prisiljava na manje serije upita ili zahtijeva preskupo premještanje podataka na sporiju pohranu.

Postojeća rješenja – izbacivanje starijih tokena, spajanje sličnih vektora ili sažimanje teksta – daju prihvatljive rezultate pri blagom smanjenju, ali drastično kvare kvalitetu kad je potreban veći stupanj kompresije. Druga recentna metoda, Cartridges, pokazala je da se KV memorija može snažno sažeti, no traži dugotrajno gradijentno optimiranje pa je nepraktična za sustave u stvarnom vremenu.

Istraživači s MIT-a zato su razvili Attention Matching, postupak koji do 50 puta smanjuje KV predmemoriju gotovo bez gubitka točnosti, a pritom radi višestruko brže od metoda temeljenih na učenju.

Ključ je u očuvanju dvaju matematičkih svojstava tijekom kompresije:

  1. attention output – izračun informacija koje model dohvati pri svakoj upotrebi memorije;
  2. attention mass – relativne „težine” koje pojedini token ima u odnosu na ostale.

Ako manja memorijska slika točno reproducira oba svojstva, model se ponaša isto kao da raspolaže originalnom, znatno većom predmemorijom.

„Attention Matching je na neki način 'ispravan' cilj za latentno sažimanje konteksta jer izravno cilja na očuvanje ponašanja svake attention glave nakon sažimanja”, dodao je Zweiger.

U stres-testovima na otvorenim modelima Llama 3.1 i Qwen-3 tehnika je isprobana na dvije vrste podataka: QuALITY, skupu dokumenata od 5 000 do 8 000 riječi, i LongHealth, složenoj kolekciji od 60 000 tokena s medicinskim zapisima više pacijenata. I pri najagresivnijem smanjenju izlazna kvaliteta ostala je gotovo nepromijenjena.

Takvo ubrzano i precizno krčenje radne memorije moglo bi otvoriti put servisiranju LLM-ova na jeftinijem hardveru te omogućiti nove aplikacije koje zahtijevaju ultradugi kontekst, bez žrtvovanja performansi.

#adam-zweiger#mit#attention-matching#quality#longhealth
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja
Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”
Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej
Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku
Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi
Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete
Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Tehnologija

Kibernetički napad oborio Canvas i poremetio nastavu tisućama škola
Masovni pad platforme Canvas zbog napada grupe "ShinyHunters" poremetio je nastavu diljem SAD-a, a hakeri prijete objavom podataka više od 8 800 škola.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja
Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana
KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Vijesti

Rovinj obilježio Dan pobjede nad nacifašizmom i Dan Europe
Grad na Valdibori polaganjem vijenca i prigodnim programom podsjetio na važnost slobode, mira i zajedništva.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Mali olimpijci preplavili Zelinu i pokazali sportski duh

Vijesti

Vinkovci na sajmu EU projekata pokazali kako fondovi mijenjaju lice grada

Politika

Sokol uzvraća Plenkoviću: „Unutarstranački nesporazumi trebaju ostati unutra, ali HDZ mora biti snažan”

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja

Sport

Vekić s ekspresnom pobjedom u polufinalu Istanbula

Biznis

Državne nekretnine otvaraju vrata poslovnim prostorima u sedam gradova

Lifestyle

Hrvatske majke sve starije i obrazovanije, a djece sve manje

Sport

Ulaznice za derbi Dinamo – Hajduk gotovo planule, Maksimir sprema vatrenu atmosferu

Vijesti

Sindikat biciklista: pet godina obećanja, a zagrebačke ulice i dalje neprijateljske za bicikle

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”

Vijesti

„Knjiga od srca“ u Senju osigurala pakete pomoći najsiromašnijima