MIT predstavio Attention Matching: nova tehnika koja 50 puta smanjuje memorijski teret velikih jezičnih modela
Nova metoda MIT-ovih istraživača pokazuje kako se radna memorija velikih jezičnih modela može smanjiti i do 50 puta, a da se pritom ne gubi kvaliteta odgovora.