Tehnologija

24. rujna 2025, 20:18

Apple predstavio EPICACHE: nova tehnika koja drastično smanjuje memorijske potrebe AI-a u dugim razgovorima

EPICACHE razbija dijalog na tematske epizode i komprimira podatke, čime do šest puta smanjuje potrošnju memorije te pritom povećava točnost i brzinu rada jezičnih modela.

min. čitanja

Appleovi istraživači osmislili su okvir EPICACHE koji velikim jezičnim modelima (LLM-ovima) omogućuje zadržavanje konteksta tijekom dugotrajnih razgovora uz do šest puta manju potrošnju memorije od postojećih pristupa.

„Nedavni napredak u LLM-ovima produljio je duljinu konteksta, no memorija potrebna za predmemoriju ključ-vrijednost linearno raste s dijalogom i brzo postaje ograničavajući čimbenik”, navodi se u radu objavljenom ovoga tjedna.

Ključni problemi i Appleovo rješenje • U višednevnim razgovorima memorija može premašiti 7 GB nakon svega 30 sesija, čak i kod razmjerno malih modela. • EPICACHE dijeli razgovor na tematski koherentne „epizode”, a zatim pri svakom novom upitu dohvaća samo relevantne dijelove. • Okvir koristi semantičko grupiranje i „adaptivnu raspodjelu memorijskog budžeta po slojevima” kako bi učinkovitije trošio resurse. • Rješenje je bez ponovnog treniranja pa se može primijeniti na postojeće modele.

Rezultati testiranja Na trima LongConvQA mjerilima sustav je: • povećao točnost do 40 % u odnosu na najnovije baseline-e; • zadržao gotovo potpunu točnost predmemorije uz 4–6× kompresiju; • smanjio latenciju do 2,4 puta, a stvarnu potrošnju memorije i do 3,5 puta.

Prednosti za poslovne korisnike Tvrtke koje uvode chatbotove, virtualne asistente ili sustave tehničke podrške često se susreću s dilemom: čuvati opsežnu povijest razgovora uz visoke troškove memorije ili štedjeti memoriju na račun konteksta. EPICACHE nudi treću opciju – održavanje dugotrajnog i personaliziranog dijaloga bez eskalacije troškova infrastrukture.

„EPICACHE ograničava rast predmemorije blokovskim unaprijednim punjenjem te epizodnim izbacivanjem sadržaja koji nije vezan uz temu”, objašnjava istraživački tim koji predvodi Minsoo Kim s korejskog Sveučilišta Hanyang u suradnji s Appleom.

Šire implikacije Ovaj rad ilustrira pomak od utrke za sve većim modelima prema optimizaciji postojećih sustava. U poslovnom okruženju, gdje svaka poruka prema AI asistentu ima svoju cijenu, učinkovitije „pamćenje” moglo bi donijeti veću konkurentsku prednost nego sama veličina modela.

#apple #epicache #minsoo-kim #sveuciliste-hanyang #longconvqa

Slično

Tehnologija

Apple traži povlačenje Zakona o digitalnim tržištima EU-a

Američki tehnološki div tvrdi da EU-ov Zakon o digitalnim tržištima krši temeljna prava i stvara sigurnosne rizike, dok Bruxelles poručuje da je interoperabilnost obvezna, a ne stvar izbora.

min čitanja

Više

Politika

Bruxelles gubi dah: od klimatskog prvaka do reaktivnog igrača

Komisija odgađa zelene uredbe, Apple traži ukidanje DMA-a, a Ursula von der Leyen govori o rušenju ruskih zrakoplova: niz poteza sugerira da EU klizi iz uloge klimatskog i regulatornog predvodnika u reaktivnu politiku prilagođavanja.

min čitanja

Više

Tehnologija

Meta predstavila Gaia2: novi test izdržljivosti AI agenata u simuliranom „stvarnom” okruženju

Otvorena platforma ARE i benchmark Gaia2 nude realističniji, stresniji i vremenski uvjetovan test sposobnosti umjetnih agenata u odnosu na dosadašnje statične provjere.

min čitanja

Više

Tehnologija

Novi RL pristup unosi paralelno razmišljanje u velike jezične modele

Framework Parallel-R1 modelima omogućuje grananje misaonih tokova, čime poboljšava točnost rješenja bez potrebe za većim modelima.

min čitanja

Više

Tehnologija

Meituan lansirao LongCat-Flash-Thinking: besplatni model od 560 milijardi parametara izaziva GPT-5

Kineski gigant objavio novu verziju otvorenog LLM-a fokusiranu na zaključivanje, uz besplatan API i permisivnu licencu.

min čitanja

Više

Tehnologija

Od zebri na farmi do „pijanih” šišmiša: dodijeljene ovogodišnje Ig Nobel nagrade

Japanske krave u zebrinim prugama, šišmiši alkoholizirani fermentiranim voćem i čašica votke koja poboljšava strani izgovor – najduhovitija znanstvena otkrića godine nagrađena su Ig Nobelom.

min čitanja

Više

Tehnologija

Zuckerberg dovodi još jedno ime iz OpenAI: Yang Song postaje ključni istraživač u Meta Superintelligence Labsu

Yang Song, dosadašnji OpenAI-jev stručnjak za velike modele, priključio se Meta Superintelligence Labsu, pridružujući se timu koji predvodi Shengjia Zhao. Transfer dolazi usred intenzivnog lova na AI talente, ali i prvih odlazaka iz novoosnovanog laboratorija.

min čitanja

Više

Tehnologija

Berlinski Vay od prosinca uvodi iznajmljivanje auta s vozačem na daljinu

Njemački start-up Vay od 1. prosinca pokreće uslugu iznajmljivanja električnih vozila koje do korisnika dovoze profesionalni vozači na daljinu, uz ambiciju da smanji potrebu za privatnim automobilima.

min čitanja

Više

Tehnologija

Qualcomm predstavio Snapdragon X2: novi udar na Intel i AMD s jačim performansama i dužim trajanjem baterije

Snapdragon X2 donosi 18 jezgri, snažniju grafiku i 80 TOPS AI-obradu, a Qualcomm tvrdi da će Windows prijenosnici dobiti višednevnu bateriju i performanse koje prestižu Intel.

min čitanja

Više

Tehnologija

Buzetski osnovci dobili najnovije LEGO setove: 8.500 eura donacija pretvoreno u 12 STEM kompleta

Osnovna škola „Vazmoslav Gržalja” prva u Hrvatskoj nabavila dvanaest novih LEGO Education Science setova zahvaljujući lokalnoj akciji koja je prikupila 8.500 eura.

min čitanja

Više

Tehnologija

24. rujna 2025, 20:18

Apple predstavio EPICACHE: nova tehnika koja drastično smanjuje memorijske potrebe AI-a u dugim razgovorima

EPICACHE razbija dijalog na tematske epizode i komprimira podatke, čime do šest puta smanjuje potrošnju memorije te pritom povećava točnost i brzinu rada jezičnih modela.

min. čitanja

#apple #epicache #minsoo-kim #sveuciliste-hanyang #longconvqa

Slično

Tehnologija

Apple traži povlačenje Zakona o digitalnim tržištima EU-a

Američki tehnološki div tvrdi da EU-ov Zakon o digitalnim tržištima krši temeljna prava i stvara sigurnosne rizike, dok Bruxelles poručuje da je interoperabilnost obvezna, a ne stvar izbora.

min čitanja

Više

Politika

Bruxelles gubi dah: od klimatskog prvaka do reaktivnog igrača

min čitanja

Više

Tehnologija

Meta predstavila Gaia2: novi test izdržljivosti AI agenata u simuliranom „stvarnom” okruženju

Otvorena platforma ARE i benchmark Gaia2 nude realističniji, stresniji i vremenski uvjetovan test sposobnosti umjetnih agenata u odnosu na dosadašnje statične provjere.

min čitanja

Više

Tehnologija

Novi RL pristup unosi paralelno razmišljanje u velike jezične modele

Framework Parallel-R1 modelima omogućuje grananje misaonih tokova, čime poboljšava točnost rješenja bez potrebe za većim modelima.

min čitanja

Više

Tehnologija

Meituan lansirao LongCat-Flash-Thinking: besplatni model od 560 milijardi parametara izaziva GPT-5

Kineski gigant objavio novu verziju otvorenog LLM-a fokusiranu na zaključivanje, uz besplatan API i permisivnu licencu.

min čitanja

Više

Tehnologija

Od zebri na farmi do „pijanih” šišmiša: dodijeljene ovogodišnje Ig Nobel nagrade

min čitanja

Više

Tehnologija

Zuckerberg dovodi još jedno ime iz OpenAI: Yang Song postaje ključni istraživač u Meta Superintelligence Labsu

min čitanja

Više

Tehnologija

Berlinski Vay od prosinca uvodi iznajmljivanje auta s vozačem na daljinu

min čitanja

Više

Tehnologija

Qualcomm predstavio Snapdragon X2: novi udar na Intel i AMD s jačim performansama i dužim trajanjem baterije

Snapdragon X2 donosi 18 jezgri, snažniju grafiku i 80 TOPS AI-obradu, a Qualcomm tvrdi da će Windows prijenosnici dobiti višednevnu bateriju i performanse koje prestižu Intel.

min čitanja

Više

Tehnologija

Buzetski osnovci dobili najnovije LEGO setove: 8.500 eura donacija pretvoreno u 12 STEM kompleta

Osnovna škola „Vazmoslav Gržalja” prva u Hrvatskoj nabavila dvanaest novih LEGO Education Science setova zahvaljujući lokalnoj akciji koja je prikupila 8.500 eura.

min čitanja

Više