CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

10. listopada 2025, 14:24

Adaptive spekulanti Together AI-ja probijaju zid performansi: ATLAS ubrzava generiranje do 400 %

Together AI predstavio je ATLAS, samoučeći sustav spekulanata koji ubrzava rad velikih jezičnih modela do 400 % i smanjuje potrebu za skupim specijaliziranim čipovima.

min. čitanja

XFacebookWhatsApp

Tvrtke koje masovno primjenjuju umjetnu inteligenciju sve češće nailaze na nevidljiv „zid” brzine kada veliki jezični modeli moraju odgovarati na sve raznolikije upite. Uzrok leži u statičnim spekulantima – manjim pomoćnim modelima koji, tijekom takozvanog spekulativnog dekodiranja, unaprijed predviđaju više tokena kako bi skratili vrijeme rada glavnog modela. Kada se radni zadaci promijene, preciznost tih spekulanata naglo pada i s njom sve prednosti.

Startup Together AI, osnovan 2023. i već financiran sa 305 milijuna dolara, predstavio je rješenje: ATLAS – AdapTive-LeArning Speculator System. Interna mjerenja pokazuju da sustav donosi i do 400 % brže izvođenje u odnosu na uobičajene engineove poput vLLM-a, a pri potpunoj prilagodbi postiže oko 500 tokena u sekundi na modelu DeepSeek-V3.1 pokrenutom na Nvidia B200 GPU-ovima – brže čak i od nekih specijaliziranih čipova.

Ključni elementi ATLAS-a:

• statični spekulant – „težak” model treniran na širokom skupu podataka pruža stabilnu početnu osnovu;

• adaptivni spekulant – lagani model koji se u hodu uči iz živog prometa i prilagođava novim domenama;

• kontrolor svjesan pouzdanosti – softverski sloj koji u realnom vremenu odlučuje kojem spekulantu dati prednost i koliko daleko „pogledati unaprijed”.

„Kada se programeri prebace s Pythona na Rust ili C, klasični spekulanti više ne pogađaju i brzina pada. Adaptivni pristup to otklanja”, objašnjava glavni znanstvenik Tri Dao. Kolega Ben Athiwaratkun dodaje da korisnici „ne moraju dirati nikakve parametre – sve se optimira iza kulisa”.

ATLAS se oslanja na cijeli niz optimizacija: FP4 kvantizacija donosi oko 80 % ubrzanja u odnosu na FP8, statični Turbo spekulant još 80–100 %, a adaptivni sloj dodatno gomila dobitke. Suština je u boljem iskorištenju GPU-a. Generiranje tokena jedno po jedno opterećuje memoriju, dok spekulant predlaže pet tokena odjednom; glavnom modelu tada je potreban samo jedan pristup memoriji za provjeru, a ne pet, pa se „prazni hod” pretvara u korisni izračun.

Za inženjere infrastrukture sustav se može promatrati kao „pametni cache” – umjesto da pohranjuje točne odgovore, uči obrasce i sve bolje predviđa što će veliki model izreći. Posebno se ističu dvije primjene: treninzi pojačanim učenjem (RL), gdje se politika stalno mijenja, i brzorastuća korporativna okruženja u kojima se chatbotovi pretvaraju u alate za pisanje koda, automatizaciju računovodstva ili upravljanje sustavima.

ATLAS je već aktiviran na namjenskim krajnjim točkama Together AI-ja bez dodatne naknade za više od 800 000 registriranih developera. Šire gledano, najava signalizira zaokret cijele industrije: softverske adaptivne tehnike na standardnom hardveru sve češće sustižu, pa i nadmašuju specijalizirana rješenja, što bi moglo dramatično preusmjeriti ulaganja u AI infrastrukturu.

#nvidia#atlas#together-ai#tri-dao#ben-athiwaratkun
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Učenici iz Labina otkrili tajne morskih znanosti u Puli
Stručni posjet učenika iz Labina pulskim znanstvenim institucijama spojio je teoriju i praksu te ih upoznao s najnovijim ekološkim i tehnološkim projektima usmjerenima na zaštitu Jadrana.

min čitanja

Više

Tehnologija

Hrvatski gaming gubi investicije, ali bilježi rast prihoda
Analiza pokazuje da, usprkos padu investicija i broju zaposlenih, prihodi hrvatske industrije videoigara dosežu rekordnih 72 milijuna eura, dok sektor traži jače državne poticaje.

min čitanja

Više

Tehnologija

Prvi hrvatski dnevni list na internetu obilježava 20 godina digitalnog izdanja
Istarski dnevnik, koji je 1997. kao prvi u Hrvatskoj ušao u online prostor, prisjeća se ključnih faza razvoja svog portala – od prve objave 2004. do velikog redizajna 2018.

min čitanja

Više

Tehnologija

Vrtići iz Vrbovskog uronili u svijet hiperautomobila i znanosti o mozgu
Osnovci iz Vrbovskog spojili Tjedan mozga s obilaskom Rimac Campusa i Instituta za istraživanje mozga u Zagrebu.

min čitanja

Više

Tehnologija

Startup planira uzgojiti „vrećice organa” kao zamjenu za pokuse na životinjama
Biotehnološki startup, potpomognut milijarderskim kapitalom, planira uzgoj nesvjesnih „vrećica organa” kako bi zamijenio pokuse na životinjama, prateći federalni plan postupnog ukidanja takvih eksperimenata.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Divovska rajčica na Trgu slobode otkrila novi Tomato: jednostavne tarife bez ugovora
Gigantska rajčica s natpisom „Slobodno!” na osječkom Trgu slobode otkrila rebrendirani Tomato i njegove nove, fleksibilne mobilne tarife.

min čitanja

Više

Tehnologija

Bežične slušalice s poništavanjem buke pale na samo 19 dolara
JLab Go Pop ANC trenutačno košta samo 19 dolara, a nudi ANC, vodootpornost i bateriju do 32 sata.

min čitanja

Više

Tehnologija

Radnici Googlea ustali protiv vojne umjetne inteligencije
Više od 3 000 Googleovih radnika 2018. se pobunilo protiv sudjelovanja tvrtke u Pentagonovu Projectu Maven, upozoravajući na opasnost da umjetna inteligencija odlučuje o pogibiji ljudi.

min čitanja

Više

Tehnologija

Dani komunikacija u fokusu: algoritmi, umjetna inteligencija i kriza povjerenja
Festival Dani komunikacija najavljuje panele o algoritmima, umjetnoj inteligenciji i krizi povjerenja publike, fokusirane na specifične izazove hrvatskog tržišta.

min čitanja

Više

Tehnologija

Ray-Ban Meta naočale sve češće izazivaju optužbe za narušavanje privatnosti
Diskretne kamere skrivene u popularnim Ray-Ban Meta naočalama sve češće potajno snimaju prolaznike, potičući tužbe i zahtjeve za strožom regulacijom.

min čitanja

Više

Najčitanije

Politika

USKOK priveo bivšeg načelnika Gradine zbog sumnje na milijunsku korupciju
Bivši načelnik Gradine Marko Ajček i još najmanje šest osoba privedeni su pod sumnjom da su općinu oštetili za više od milijun eura.

min čitanja

Više

Vijesti

Krka djecu vodi u šumsku radionicu povodom Svjetskog dana šuma
NP Krka 28. ožujka organizira besplatnu šumsku radionicu za djecu kako bi obilježio Svjetski dan šuma i potaknuo najmlađe na brigu o prirodi.

min čitanja

Više

Učitavam...

Najnovije

Lifestyle

Besplatno mjerenje tlaka i šećera na Gornjem Zametu 26. ožujka

Biznis

Slavonska kuća šunke: novi korak za očuvanje tradicije u Starim Mikanovcima

Politika

Strah pred kućnim pragom: obitelj Ava i Sam suočena s dolaskom ICE-a

Biznis

Talijanski regulator udario Trustpilot s 4 milijuna eura kazne

Politika

Baška Voda počela sanirati divlje odlagalište u kamenolomu: Radić optužio bivšu vlast

Vijesti

Krk ulaže u sport, vrtić i društveni dom

Biznis

HT dioničarima predlaže rekordnih 1,69 eura dividende

Vijesti

Premijera „Logora/Golgote” u ZeKaeM-u izazvala razočaranje kritike

Biznis

Ratna neizvjesnost i naftni skok vuku europske burze nadolje

Politika

Britanski razarač HMS Dragon pristao na Cipru, London širi vojnu prisutnost

Sport

Turnir prijateljstva u Umagu: rekreativci iz regije, glazbenik Džinović i rukometne legende na terenu