CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

13. siječnja 2026, 20:29

DeepSeek predstavlja Engram: hibridna arhitektura koja štedi GPU memoriju i poboljšava rezoniranje

Novi modul Engram donosi uvjetno pamćenje, smanjuje ovisnost o GPU memoriji i pojačava rezoniranje velikih jezičnih modela.

min. čitanja

XFacebookWhatsApp

DeepSeek je predstavio modul Engram koji uvodi „uvjetno pamćenje”, nadopunjujući postojeće sustave rijetke aktivacije (MoE – mixture of experts) i otvarajući novu fazu u gradnji velikih jezičnih modela.

Glavna ideja: model paralelno koristi dva sustava
• 75–80 % kapaciteta ostaje namijenjeno izračunu (MoE)
• 20–25 % dobiva ugrađena memorija (Engram)

Stručnjaci tvrde da ekstremi nisu učinkoviti. Čisti MoE troši slojeve na ponovno otkrivanje statičnih uzoraka, dok previše memorije slabi sposobnost rezoniranja. Testovi su pokazali da je zlatna sredina upravo opisani omjer.

Kako radi uvjetno pamćenje

  1. Modul uzima dvotročlane sekvence tokena i preko hash funkcija ih traži u golemoj tablici ugrađenih vektora.
  2. Vraćeni zapisi prolaze dodatnu provjeru: „vrata” uspoređuju pronađeni sadržaj s kontekstom koji je model do tada izgradio.
  3. Ako informacija odudara od konteksta, blokira se; ako se uklapa, pušta se dalje.
  4. Engram se ubacuje samo u odabrane slojeve kako bi se izbjegla kašnjenja.

Pametno zaobilaženje GPU ograničenja

Latimer iz istraživačkog tima objašnjava: „The challenge is that GPU memory is limited and expensive, so using bigger models gets costly and harder to deploy. The clever idea behind Engram is to keep the main model on the GPU, but offload a big chunk of the model's stored information into a separate memory on regular RAM, which the model can use on a just-in-time basis.”

Zahvaljujući determinističkom indeksiranju (ovisnom isključivo o ulaznim tokenima), sustav unaprijed dohvaća potrebne vektore iz radne memorije računala putem PCIe sabirnice. Dok GPU obrađuje rane transformatorske blokove, CPU u pozadini doprema podatke. Demonstracija s tablicom od 100 milijardi parametara potpuno prebačenom u DRAM pokazala je usporenje manje od 3 %.

Posljedice za tvrtke koje planiraju AI infrastrukturu

• Hibridne arhitekture nadmašuju čiste pristupe; Engramov omjer 75/25 mogao bi postati novi standard.
• Trošak se seli s GPU-a na radnu memoriju: bogate RAM konfiguracije s umjerenim brojem GPU-ova mogu nuditi bolji omjer cijene i performansi.
• Najveći skok mjeri se u sposobnosti rezoniranja, ne samo u pukom prisjećanju činjenica.

Zaključak istraživača glasi da budući temeljni modeli neće biti samo „veći”, nego i pametnije raspoređeni. Tvrtke koje planiraju kasniji ulazak u AI trebale bi pratiti hoće li vodeći proizvođači usvojiti uvjetno pamćenje – jer bi ono moglo značajno smanjiti troškove uz istodobno povećanje kvalitete zaključivanja.

#deepseek#engram#latimer#uvjetno-pamcenje
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja
Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”
Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej
Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku
Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi
Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete
Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Tehnologija

Kibernetički napad oborio Canvas i poremetio nastavu tisućama škola
Masovni pad platforme Canvas zbog napada grupe "ShinyHunters" poremetio je nastavu diljem SAD-a, a hakeri prijete objavom podataka više od 8 800 škola.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja
Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana
KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Vijesti

Rovinj obilježio Dan pobjede nad nacifašizmom i Dan Europe
Grad na Valdibori polaganjem vijenca i prigodnim programom podsjetio na važnost slobode, mira i zajedništva.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Mali olimpijci preplavili Zelinu i pokazali sportski duh

Vijesti

Vinkovci na sajmu EU projekata pokazali kako fondovi mijenjaju lice grada

Politika

Sokol uzvraća Plenkoviću: „Unutarstranački nesporazumi trebaju ostati unutra, ali HDZ mora biti snažan”

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja

Sport

Vekić s ekspresnom pobjedom u polufinalu Istanbula

Biznis

Državne nekretnine otvaraju vrata poslovnim prostorima u sedam gradova

Lifestyle

Hrvatske majke sve starije i obrazovanije, a djece sve manje

Sport

Ulaznice za derbi Dinamo – Hajduk gotovo planule, Maksimir sprema vatrenu atmosferu

Vijesti

Sindikat biciklista: pet godina obećanja, a zagrebačke ulice i dalje neprijateljske za bicikle

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”

Vijesti

„Knjiga od srca“ u Senju osigurala pakete pomoći najsiromašnijima