CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

10. listopada 2025, 14:24

Adaptive spekulanti Together AI-ja probijaju zid performansi: ATLAS ubrzava generiranje do 400 %

Together AI predstavio je ATLAS, samoučeći sustav spekulanata koji ubrzava rad velikih jezičnih modela do 400 % i smanjuje potrebu za skupim specijaliziranim čipovima.

min. čitanja

XFacebookWhatsApp

Tvrtke koje masovno primjenjuju umjetnu inteligenciju sve češće nailaze na nevidljiv „zid” brzine kada veliki jezični modeli moraju odgovarati na sve raznolikije upite. Uzrok leži u statičnim spekulantima – manjim pomoćnim modelima koji, tijekom takozvanog spekulativnog dekodiranja, unaprijed predviđaju više tokena kako bi skratili vrijeme rada glavnog modela. Kada se radni zadaci promijene, preciznost tih spekulanata naglo pada i s njom sve prednosti.

Startup Together AI, osnovan 2023. i već financiran sa 305 milijuna dolara, predstavio je rješenje: ATLAS – AdapTive-LeArning Speculator System. Interna mjerenja pokazuju da sustav donosi i do 400 % brže izvođenje u odnosu na uobičajene engineove poput vLLM-a, a pri potpunoj prilagodbi postiže oko 500 tokena u sekundi na modelu DeepSeek-V3.1 pokrenutom na Nvidia B200 GPU-ovima – brže čak i od nekih specijaliziranih čipova.

Ključni elementi ATLAS-a:

• statični spekulant – „težak” model treniran na širokom skupu podataka pruža stabilnu početnu osnovu;

• adaptivni spekulant – lagani model koji se u hodu uči iz živog prometa i prilagođava novim domenama;

• kontrolor svjesan pouzdanosti – softverski sloj koji u realnom vremenu odlučuje kojem spekulantu dati prednost i koliko daleko „pogledati unaprijed”.

„Kada se programeri prebace s Pythona na Rust ili C, klasični spekulanti više ne pogađaju i brzina pada. Adaptivni pristup to otklanja”, objašnjava glavni znanstvenik Tri Dao. Kolega Ben Athiwaratkun dodaje da korisnici „ne moraju dirati nikakve parametre – sve se optimira iza kulisa”.

ATLAS se oslanja na cijeli niz optimizacija: FP4 kvantizacija donosi oko 80 % ubrzanja u odnosu na FP8, statični Turbo spekulant još 80–100 %, a adaptivni sloj dodatno gomila dobitke. Suština je u boljem iskorištenju GPU-a. Generiranje tokena jedno po jedno opterećuje memoriju, dok spekulant predlaže pet tokena odjednom; glavnom modelu tada je potreban samo jedan pristup memoriji za provjeru, a ne pet, pa se „prazni hod” pretvara u korisni izračun.

Za inženjere infrastrukture sustav se može promatrati kao „pametni cache” – umjesto da pohranjuje točne odgovore, uči obrasce i sve bolje predviđa što će veliki model izreći. Posebno se ističu dvije primjene: treninzi pojačanim učenjem (RL), gdje se politika stalno mijenja, i brzorastuća korporativna okruženja u kojima se chatbotovi pretvaraju u alate za pisanje koda, automatizaciju računovodstva ili upravljanje sustavima.

ATLAS je već aktiviran na namjenskim krajnjim točkama Together AI-ja bez dodatne naknade za više od 800 000 registriranih developera. Šire gledano, najava signalizira zaokret cijele industrije: softverske adaptivne tehnike na standardnom hardveru sve češće sustižu, pa i nadmašuju specijalizirana rješenja, što bi moglo dramatično preusmjeriti ulaganja u AI infrastrukturu.

#nvidia#atlas#together-ai#tri-dao#ben-athiwaratkun

Slično

Tehnologija

Aplikacija Nomiea djeci otvara svijet klavira kroz igru
Nomiea, nova aplikacija koja djeci kroz igru otkriva klavir i glazbenu teoriju, predstavljena je u Dječjoj kući uz podršku stručnjaka i niz interaktivnih radionica.

min čitanja

Više

Tehnologija

Orqin hackathon na EFOS-u: studenti rješavali izazove, a tvrtka lovi nove talente
Na EFOS-u je održan Orqin hackathon na kojem su studenti radili na strategiji za usklađivanje triju Orqinih tržišta – vojnog, potrošačke elektronike i obrazovnog – dok brzo rastuća osječka tvrtka traži svježe ideje i nove zaposlenike.

min čitanja

Više

Tehnologija

Del Toro upozorava: „Algoritam ne smije istisnuti ljudsku maštu“
Guillermo del Toro kritizira bezrezervno korištenje umjetne inteligencije u filmu i otkriva detalje o svom novom, za Zlatni globus nominiranom, „Frankensteinu“.

min čitanja

Više

Tehnologija

Google i NextEra oživljavaju nuklearku u Iowi za pogon podatkovnih centara
Napuštena nuklearna elektrana Duane Arnold predviđena je za ponovno pokretanje 2029. zahvaljujući partnerstvu između Googlea i NextEra Energyja, koje bi trebalo osigurati 600 MW stalne struje za rastuću mrežu podatkovnih centara u Iowi.

min čitanja

Više

Tehnologija

AI2 lansirao Olmo 3.1, dosad najmoćniji model s naglaskom na učinkovitost i kontrolu
Allen Institute for AI predstavio je Olmo 3.1, novu i snažniju generaciju jezičnih modela usmjerenih na učinkovitost, transparentnost i precizno praćenje uputa.

min čitanja

Više

Tehnologija

Google i UC Santa Barbara razvili "štedljive" tehnike za velike jezične agente
Nova studija pokazuje kako agentima velikih jezičnih modela dati „osjećaj za novčanik” i tako uštedjeti tokene, vrijeme i novac.

min čitanja

Više

Tehnologija

Prvi hrvatski baterijski vlak ulazi u redoviti promet između Splita i Kaštel Staroga
Vlak domaće tvrtke Končar – Električna vozila od 15. prosinca svakodnevno će prevoziti putnike na relaciji Split – Kaštel Stari, otvarajući novu eru baterijskih vlakova na hrvatskim prugama.

min čitanja

Više

Tehnologija

Zagrebački „Guru za kulturu” pokazuje put: Riječani zazivaju vlastitu jedinstvenu platformu
Zagrebačka aplikacija „Guru za kulturu” objedinjuje sve kulturne događaje na jednom mjestu, a riječki kulturnjaci sada traže sličnu platformu za svoj grad.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Neprofitna inicijativa Fulu plaća hakere da ožive „mrtve” uređaje
Fulu nudi novčane nagrade za hakere koji oslobode potrošače ograničenja i produže vijek trajanja uređaja koje su proizvođači već otpisali.

min čitanja

Više

Tehnologija

Kadmij-cinkov telurid skratio bolničke CT preglede na 15 minuta
Brži pregledi, manje zračenja i jasnije slike: londonska bolnica uvela skener s kristalima kadmij-cinkovog telurida.

min čitanja

Više

Najčitanije

Politika

Tisuće Mađara traže Orbanovu ostavku zbog skandala u maloljetničkom centru
Prosvjednici u Budimpešti nose plišane igračke i baklje, tražeći odgovornost za lanac zlostavljanja i trgovine ljudima u državnim ustanovama za maloljetnike.

min čitanja

Više

Nogomet

Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556

Rebić i Šego donijeli Hajduku preokret i povratak na vrh
Splićani su na Maksimiru svladali Lokomotivu 3-1, prekinuli trociklus bez pobjede i preskočili Dinamo na vrhu HNL-a, dok Lokomotiva produžuje crni niz.

min čitanja

Više

Politika

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234
Babiš odbija češka jamstva za novi zajam Ukrajini
Novi premijer Andrej Babiš najavio da Češka neće jamčiti za planirani europski kredit Ukrajini, pozvavši Bruxelles da pronađe druge načine potpore.

min čitanja

Više

Nogomet

Osječani i dalje u slobodnom padu, Gorica izdržala s igračem manje
Osijek je protiv Gorice odigrao samo 1-1 i ostao posljednji, iako je više od pola sata imao igrača više.

min čitanja

Više

Skijanje

Švicarska ofenziva u Val d’Isereu: Meillard slavio, Zubčić 24.
Švicarsko trostruko slavlje u veleslalomu Val d’Iserea, Meillard prvi, Zubčić 24.

min čitanja

Više

Vijesti

Pokušaj ubojstva u Velikoj Gorici: 26-godišnjak oštrim predmetom napao 21-godišnjakinju
Mladić (26) u Velikoj Gorici pokušao usmrtiti 21-godišnjakinju oštrim predmetom; žrtva zadobila lakše ozljede, napadač uhićen.

min čitanja

Više

Najnovije

Vijesti

Prvi slučaj kuge malih preživača u Hrvatskoj

Sport

Sopić ističe borbu za ostanak, Carević hvali hrabrost nakon remija Osijeka i Gorice

Sport

Lazio s devet igrača šokirao Parmu, isključen i Bašić

Sport

Požega najuspješnija prvog dana Dubrovnik Opena, domaćin uzeo četiri odličja

Politika

Vukušić prozvao Sarnavku zbog „dvostrukih standarda” u slučaju Ružice Ćavar

Sport

Split nastavio pobjednički niz, Vujičićev projektil donio dramu u Rijeci

Vijesti

Božić sunca i magle, prava zima možda tek krajem godine

Politika

Tisuće Mađara traže Orbanovu ostavku zbog skandala u maloljetničkom centru

Sport

Vlašićev gol prekinuo crni niz Torina

Sport

Brza razmjena golova na Maksimiru: Lokomotiva i Hajduk poravnati već nakon 20 minuta

Vijesti

Napad na policajku: slučaj marokanskog državljanina izazvao žestoke reakcije u Zadru