Učitavam...

Tehnologija

18. ožujka 2026, 06:28

Nvidia smanjuje glad za memorijom velikih jezičnih modela novom tehnikom kodiranja

KV Cache Transform Coding komprimira memoriju transformera do 20 puta i ubrzava generiranje odgovora, najavljuje Nvidia.

min. čitanja

Istraživači Nvidije predstavili su tehniku KV Cache Transform Coding (KVTC) koja, bez mijenjanja samog modela, smanjuje memorijske potrebe velikih jezičnih modela za pohranu razgovorne povijesti i do 20 puta.

KVTC prenosi principe kompresije iz medijskih formata poput JPEG-a na ključno-vrijednosni spremnik (key-value cache) transformera. Time se znatno rasterećuju grafičke kartice, a vrijeme do ispisivanja prvog tokena ubrzava se do osam puta.

U praksi to znači da se napredni višekratni dijaloški sustavi mogu pokretati na manjem broju ili slabijim GPU-ovima, otvarajući prostor za veće modele ili niže troškove rada postojećih.

Iako je tehnika zasad istraživačke naravi, njezino uvođenje moglo bi pojednostaviti razvoj i implementaciju generativne umjetne inteligencije u širokom rasponu primjena – od cloud servisa do lokalno pokretanih aplikacija.

#umjetna-inteligencija #gpu #nvidija #kvtc #jpeg

Zatražite oglasni prostor

Učitavam...

Komentari ~ 0

Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”

Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Čudni verbalni tikovi ChatGPT-a sve više iritiraju kineske korisnike

Kineski korisnici sve češće kritiziraju ChatGPT zbog neprirodnih fraza koje se uporno ponavljaju u njegovim odgovorima.

min čitanja

Više

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja

Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej

Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku

Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru

Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija

UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva

Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi

Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete

Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Zatražite oglasni prostor

Učitavam...

Zatražite oglasni prostor

Učitavam...

Tehnologija

18. ožujka 2026, 06:28

Nvidia smanjuje glad za memorijom velikih jezičnih modela novom tehnikom kodiranja

KV Cache Transform Coding komprimira memoriju transformera do 20 puta i ubrzava generiranje odgovora, najavljuje Nvidia.

min. čitanja

U praksi to znači da se napredni višekratni dijaloški sustavi mogu pokretati na manjem broju ili slabijim GPU-ovima, otvarajući prostor za veće modele ili niže troškove rada postojećih.

#umjetna-inteligencija #gpu #nvidija #kvtc #jpeg

Zatražite oglasni prostor

Učitavam...

Komentari ~ 0

Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”

Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Čudni verbalni tikovi ChatGPT-a sve više iritiraju kineske korisnike

Kineski korisnici sve češće kritiziraju ChatGPT zbog neprirodnih fraza koje se uporno ponavljaju u njegovim odgovorima.

min čitanja

Više

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja

Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej

Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku

Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru

Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva

Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi

Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete

Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Zatražite oglasni prostor

Učitavam...