CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

24. rujna 2025, 20:18

Apple predstavio EPICACHE: nova tehnika koja drastično smanjuje memorijske potrebe AI-a u dugim razgovorima

EPICACHE razbija dijalog na tematske epizode i komprimira podatke, čime do šest puta smanjuje potrošnju memorije te pritom povećava točnost i brzinu rada jezičnih modela.

min. čitanja

Appleovi istraživači osmislili su okvir EPICACHE koji velikim jezičnim modelima (LLM-ovima) omogućuje zadržavanje konteksta tijekom dugotrajnih razgovora uz do šest puta manju potrošnju memorije od postojećih pristupa.

„Nedavni napredak u LLM-ovima produljio je duljinu konteksta, no memorija potrebna za predmemoriju ključ-vrijednost linearno raste s dijalogom i brzo postaje ograničavajući čimbenik”, navodi se u radu objavljenom ovoga tjedna.

Ključni problemi i Appleovo rješenje • U višednevnim razgovorima memorija može premašiti 7 GB nakon svega 30 sesija, čak i kod razmjerno malih modela. • EPICACHE dijeli razgovor na tematski koherentne „epizode”, a zatim pri svakom novom upitu dohvaća samo relevantne dijelove. • Okvir koristi semantičko grupiranje i „adaptivnu raspodjelu memorijskog budžeta po slojevima” kako bi učinkovitije trošio resurse. • Rješenje je bez ponovnog treniranja pa se može primijeniti na postojeće modele.

Rezultati testiranja Na trima LongConvQA mjerilima sustav je: • povećao točnost do 40 % u odnosu na najnovije baseline-e; • zadržao gotovo potpunu točnost predmemorije uz 4–6× kompresiju; • smanjio latenciju do 2,4 puta, a stvarnu potrošnju memorije i do 3,5 puta.

Prednosti za poslovne korisnike Tvrtke koje uvode chatbotove, virtualne asistente ili sustave tehničke podrške često se susreću s dilemom: čuvati opsežnu povijest razgovora uz visoke troškove memorije ili štedjeti memoriju na račun konteksta. EPICACHE nudi treću opciju – održavanje dugotrajnog i personaliziranog dijaloga bez eskalacije troškova infrastrukture.

„EPICACHE ograničava rast predmemorije blokovskim unaprijednim punjenjem te epizodnim izbacivanjem sadržaja koji nije vezan uz temu”, objašnjava istraživački tim koji predvodi Minsoo Kim s korejskog Sveučilišta Hanyang u suradnji s Appleom.

Šire implikacije Ovaj rad ilustrira pomak od utrke za sve većim modelima prema optimizaciji postojećih sustava. U poslovnom okruženju, gdje svaka poruka prema AI asistentu ima svoju cijenu, učinkovitije „pamćenje” moglo bi donijeti veću konkurentsku prednost nego sama veličina modela.

#apple#epicache#minsoo-kim#sveuciliste-hanyang#longconvqa

Slično

Tehnologija

Apple traži povlačenje Zakona o digitalnim tržištima EU-a
Američki tehnološki div tvrdi da EU-ov Zakon o digitalnim tržištima krši temeljna prava i stvara sigurnosne rizike, dok Bruxelles poručuje da je interoperabilnost obvezna, a ne stvar izbora.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Politika

Bruxelles gubi dah: od klimatskog prvaka do reaktivnog igrača
Komisija odgađa zelene uredbe, Apple traži ukidanje DMA-a, a Ursula von der Leyen govori o rušenju ruskih zrakoplova: niz poteza sugerira da EU klizi iz uloge klimatskog i regulatornog predvodnika u reaktivnu politiku prilagođavanja.
Autor European People's Party - EPP Lead Candidate Multimedia Content, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=148344970

min čitanja

Više

Tehnologija

Meta predstavila Gaia2: novi test izdržljivosti AI agenata u simuliranom „stvarnom” okruženju
Otvorena platforma ARE i benchmark Gaia2 nude realističniji, stresniji i vremenski uvjetovan test sposobnosti umjetnih agenata u odnosu na dosadašnje statične provjere.

min čitanja

Više

Tehnologija

Novi RL pristup unosi paralelno razmišljanje u velike jezične modele
Framework Parallel-R1 modelima omogućuje grananje misaonih tokova, čime poboljšava točnost rješenja bez potrebe za većim modelima.

min čitanja

Više

Tehnologija

Meituan lansirao LongCat-Flash-Thinking: besplatni model od 560 milijardi parametara izaziva GPT-5
Kineski gigant objavio novu verziju otvorenog LLM-a fokusiranu na zaključivanje, uz besplatan API i permisivnu licencu.

min čitanja

Više

Tehnologija

Od zebri na farmi do „pijanih” šišmiša: dodijeljene ovogodišnje Ig Nobel nagrade
Japanske krave u zebrinim prugama, šišmiši alkoholizirani fermentiranim voćem i čašica votke koja poboljšava strani izgovor – najduhovitija znanstvena otkrića godine nagrađena su Ig Nobelom.

min čitanja

Više

Tehnologija

Zuckerberg dovodi još jedno ime iz OpenAI: Yang Song postaje ključni istraživač u Meta Superintelligence Labsu
Yang Song, dosadašnji OpenAI-jev stručnjak za velike modele, priključio se Meta Superintelligence Labsu, pridružujući se timu koji predvodi Shengjia Zhao. Transfer dolazi usred intenzivnog lova na AI talente, ali i prvih odlazaka iz novoosnovanog laboratorija.
Anthony Quintano from Honolulu, HI, United States, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Berlinski Vay od prosinca uvodi iznajmljivanje auta s vozačem na daljinu
Njemački start-up Vay od 1. prosinca pokreće uslugu iznajmljivanja električnih vozila koje do korisnika dovoze profesionalni vozači na daljinu, uz ambiciju da smanji potrebu za privatnim automobilima.

min čitanja

Više

Tehnologija

Qualcomm predstavio Snapdragon X2: novi udar na Intel i AMD s jačim performansama i dužim trajanjem baterije
Snapdragon X2 donosi 18 jezgri, snažniju grafiku i 80 TOPS AI-obradu, a Qualcomm tvrdi da će Windows prijenosnici dobiti višednevnu bateriju i performanse koje prestižu Intel.

min čitanja

Više

Tehnologija

Buzetski osnovci dobili najnovije LEGO setove: 8.500 eura donacija pretvoreno u 12 STEM kompleta
Osnovna škola „Vazmoslav Gržalja” prva u Hrvatskoj nabavila dvanaest novih LEGO Education Science setova zahvaljujući lokalnoj akciji koja je prikupila 8.500 eura.

min čitanja

Više

Najčitanije

Vijesti

Tragedija na pruzi kod Osijeka: vlak usmrtio 87-godišnjakinju
Žena od 87 godina poginula je jutros u Briješću kraj Osijeka nakon što ju je prilikom prelaska pruge udario vlak; policijski očevid još traje.

min čitanja

Više

Politika

Trump tvrdi da je žrtva trostruke sabotaže u UN-u
Trump problematične pokretne stepenice, ugašeni teleprompter i nestanak zvuka naziva „trostrukom sabotažom” te traži hitnu istragu Ujedinjenih naroda.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Nogomet

Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542

Trener Fenerbahçea priznao probleme nakon poraza u Zagrebu
Nakon gostujućeg poraza od Dinama, trener Fenerbahçea otvoreno je priznao obrambene propuste i pohvalio mladog Hoxhu, najavivši dodatni rad kako bi turski klub izašao iz rezultatske krize.

min čitanja

Više

Najnovije

Lifestyle

Thompson planira dvostruki nastup u Osijeku krajem studenog

Vijesti

Bez razdjelnika slijede paprene naknade za grijanje

Vijesti

Sudar Mazde i Audija usred jutarnje špice u Osijeku

Vijesti

Splitski redar u rikverc po kaznu: promet stao, društvene mreže ključale

Sport

Palmeiras izbacio River i peti put u šest godina stigao do polufinala Copa Libertadores

Politika

Zastupnik u EP-u nehotice pozvao sudanske milicajce; događaj otkazan u zadnji čas

Biznis

Bruxelles priznao: trgovinski dogovor s Washingtonom ne ispunjava WTO kriterije

Politika

Dvostruki udar na zelene politike: Bruxelles odgađa zabranu krčenja šuma, zastupnici ruše nadzorni zakon

Tehnologija

Meta predstavila Gaia2: novi test izdržljivosti AI agenata u simuliranom „stvarnom” okruženju

Politika

Tenkovi protiv traktora: novi proračun EU-a suprotstavlja obranu i poljoprivredu

Vijesti

Dijete lakše ozlijeđeno u sudaru bicikla i automobila u Vinkovcima