CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

13. siječnja 2026, 20:29

DeepSeek predstavlja Engram: hibridna arhitektura koja štedi GPU memoriju i poboljšava rezoniranje

Novi modul Engram donosi uvjetno pamćenje, smanjuje ovisnost o GPU memoriji i pojačava rezoniranje velikih jezičnih modela.

min. čitanja

XFacebookWhatsApp

DeepSeek je predstavio modul Engram koji uvodi „uvjetno pamćenje”, nadopunjujući postojeće sustave rijetke aktivacije (MoE – mixture of experts) i otvarajući novu fazu u gradnji velikih jezičnih modela.

Glavna ideja: model paralelno koristi dva sustava
• 75–80 % kapaciteta ostaje namijenjeno izračunu (MoE)
• 20–25 % dobiva ugrađena memorija (Engram)

Stručnjaci tvrde da ekstremi nisu učinkoviti. Čisti MoE troši slojeve na ponovno otkrivanje statičnih uzoraka, dok previše memorije slabi sposobnost rezoniranja. Testovi su pokazali da je zlatna sredina upravo opisani omjer.

Kako radi uvjetno pamćenje

  1. Modul uzima dvotročlane sekvence tokena i preko hash funkcija ih traži u golemoj tablici ugrađenih vektora.
  2. Vraćeni zapisi prolaze dodatnu provjeru: „vrata” uspoređuju pronađeni sadržaj s kontekstom koji je model do tada izgradio.
  3. Ako informacija odudara od konteksta, blokira se; ako se uklapa, pušta se dalje.
  4. Engram se ubacuje samo u odabrane slojeve kako bi se izbjegla kašnjenja.

Pametno zaobilaženje GPU ograničenja

Latimer iz istraživačkog tima objašnjava: „The challenge is that GPU memory is limited and expensive, so using bigger models gets costly and harder to deploy. The clever idea behind Engram is to keep the main model on the GPU, but offload a big chunk of the model's stored information into a separate memory on regular RAM, which the model can use on a just-in-time basis.”

Zahvaljujući determinističkom indeksiranju (ovisnom isključivo o ulaznim tokenima), sustav unaprijed dohvaća potrebne vektore iz radne memorije računala putem PCIe sabirnice. Dok GPU obrađuje rane transformatorske blokove, CPU u pozadini doprema podatke. Demonstracija s tablicom od 100 milijardi parametara potpuno prebačenom u DRAM pokazala je usporenje manje od 3 %.

Posljedice za tvrtke koje planiraju AI infrastrukturu

• Hibridne arhitekture nadmašuju čiste pristupe; Engramov omjer 75/25 mogao bi postati novi standard.
• Trošak se seli s GPU-a na radnu memoriju: bogate RAM konfiguracije s umjerenim brojem GPU-ova mogu nuditi bolji omjer cijene i performansi.
• Najveći skok mjeri se u sposobnosti rezoniranja, ne samo u pukom prisjećanju činjenica.

Zaključak istraživača glasi da budući temeljni modeli neće biti samo „veći”, nego i pametnije raspoređeni. Tvrtke koje planiraju kasniji ulazak u AI trebale bi pratiti hoće li vodeći proizvođači usvojiti uvjetno pamćenje – jer bi ono moglo značajno smanjiti troškove uz istodobno povećanje kvalitete zaključivanja.

#deepseek#engram#latimer#uvjetno-pamcenje

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Egnyte uvodi AI alate u razvojni proces, ali zadržava ljudsku kontrolu
Egnyte kombinira generativnu umjetnu inteligenciju i strogu ručnu kontrolu kako bi ubrzao razvojni ciklus i lansirao nove AI proizvode.

min čitanja

Više

Tehnologija

Japanski startup Sakana AI s agentom ALE-Agent pokorio AtCoder i najavio eru autonomne optimizacije
ALE-Agent sa samo četiri sata računalnog rada svladao je više od 800 programera na AtCoderu, pokazujući kako autonomni AI optimizacijski agenti mogu preoblikovati poslovne procese.

min čitanja

Više

Tehnologija

WhatsApp prevara uzbunila Komižu i Vis: hakirani profili tražili 950 eura
Poruka s tuđih WhatsApp profila tražila uplatu od 950 eura; zahvaljujući sumnji otočana nitko nije ostao bez novca.

min čitanja

Više

Tehnologija

Trokut najavio radionicu „Brza prilagodba i agilno učenje” dr. Ivica Poljičaka
Tehnološki park Trokut 19. siječnja domaćin je trosatne radionice o agilnom učenju pod vodstvom dr. Ivica Poljičaka.

min čitanja

Više

Tehnologija

Inženjerka Lada razotkrila prijevaru s lažnim registrima i napravila aplikaciju za zaštitu poduzetnika
Lada Kovjanić razvila je aplikaciju koja novim poduzetnicima šalje e-mail upozorenje da ne moraju plaćati sporne uplatnice za navodni upis u poslovni registar.

min čitanja

Više

Tehnologija

Nakon pokolja u Bondiju, lažni video policijske šefice poharao društvene mreže
Duboko lažirani video s izmišljenim uhićenjima proširio se nakon napada u Bondiju, otkrivajući koliko su deepfake tehnologije postale moćne i opasne.

min čitanja

Više

Tehnologija

Američki MATERIAL prikupio 7,1 milijun dolara za „beztjelesne” baterije
Start-up iz Miamija prikupio je 7,1 milijun USD i potpisao ugovor s Ratnim zrakoplovstvom SAD-a za razvoj baterija koje se oblikuju prema uređaju, obećavajući 50 % veću gustoću energije i 22 % manju masu modula.

min čitanja

Više

Tehnologija

Salesforce pretvara Slackbota u moćnog AI agenta
Revolucionirani Slackbot sada pretražuje podatke, piše dokumente i samostalno izvršava zadatke, a već ga koristi velika većina Salesforceovih zaposlenika.

min čitanja

Više

Tehnologija

Nestašica čipova gasi rast tržišta mobitela
Counterpoint Research predviđa pad svjetske prodaje pametnih telefona u 2026. zbog nestašice čipova i skupljih dijelova.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Ruska neurokirurginja izaziva dogmu: Bekhtereva tvrdi da se svijest ne gasi nakon smrti
Snažni moždani impulsi i gotovo identična svjedočanstva preživjelih kliničke smrti navode Nataliju Bekhtereve da preispita dosadašnje shvaćanje kraja života.

min čitanja

Više

Najnovije

Politika

Anušić u Oslu jača vojnu suradnju s Norveškom

Politika

EU pozvala iranskog veleposlanika zbog brutalnog gušenja prosvjeda

Sport

Slovenski rukometaši pogođeni nizom ozljeda uoči Eura

Biznis

Svjetska banka snizila prognozu rasta: Hrvatska i Bugarska na 2,9 posto

Tehnologija

Egnyte uvodi AI alate u razvojni proces, ali zadržava ljudsku kontrolu

Sport

Osijek i Gorica slavili u pripremama, Vukovar 1991 u finišu izborio finale Arena kupa

Vijesti

Inspektori zapečatili ilegalnu klaonicu u kaštelanskom zaleđu

Vijesti

ICE u Minnesoti hitno oprema vozila rotirkama i sirenama

Tehnologija

Japanski startup Sakana AI s agentom ALE-Agent pokorio AtCoder i najavio eru autonomne optimizacije

Politika

Nezavisni prozvali Beli Manastir zbog neočišćenih ulica