CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

10. listopada 2025, 14:24

Adaptive spekulanti Together AI-ja probijaju zid performansi: ATLAS ubrzava generiranje do 400 %

Together AI predstavio je ATLAS, samoučeći sustav spekulanata koji ubrzava rad velikih jezičnih modela do 400 % i smanjuje potrebu za skupim specijaliziranim čipovima.

min. čitanja

XFacebookWhatsApp

Tvrtke koje masovno primjenjuju umjetnu inteligenciju sve češće nailaze na nevidljiv „zid” brzine kada veliki jezični modeli moraju odgovarati na sve raznolikije upite. Uzrok leži u statičnim spekulantima – manjim pomoćnim modelima koji, tijekom takozvanog spekulativnog dekodiranja, unaprijed predviđaju više tokena kako bi skratili vrijeme rada glavnog modela. Kada se radni zadaci promijene, preciznost tih spekulanata naglo pada i s njom sve prednosti.

Startup Together AI, osnovan 2023. i već financiran sa 305 milijuna dolara, predstavio je rješenje: ATLAS – AdapTive-LeArning Speculator System. Interna mjerenja pokazuju da sustav donosi i do 400 % brže izvođenje u odnosu na uobičajene engineove poput vLLM-a, a pri potpunoj prilagodbi postiže oko 500 tokena u sekundi na modelu DeepSeek-V3.1 pokrenutom na Nvidia B200 GPU-ovima – brže čak i od nekih specijaliziranih čipova.

Ključni elementi ATLAS-a:

• statični spekulant – „težak” model treniran na širokom skupu podataka pruža stabilnu početnu osnovu;

• adaptivni spekulant – lagani model koji se u hodu uči iz živog prometa i prilagođava novim domenama;

• kontrolor svjesan pouzdanosti – softverski sloj koji u realnom vremenu odlučuje kojem spekulantu dati prednost i koliko daleko „pogledati unaprijed”.

„Kada se programeri prebace s Pythona na Rust ili C, klasični spekulanti više ne pogađaju i brzina pada. Adaptivni pristup to otklanja”, objašnjava glavni znanstvenik Tri Dao. Kolega Ben Athiwaratkun dodaje da korisnici „ne moraju dirati nikakve parametre – sve se optimira iza kulisa”.

ATLAS se oslanja na cijeli niz optimizacija: FP4 kvantizacija donosi oko 80 % ubrzanja u odnosu na FP8, statični Turbo spekulant još 80–100 %, a adaptivni sloj dodatno gomila dobitke. Suština je u boljem iskorištenju GPU-a. Generiranje tokena jedno po jedno opterećuje memoriju, dok spekulant predlaže pet tokena odjednom; glavnom modelu tada je potreban samo jedan pristup memoriji za provjeru, a ne pet, pa se „prazni hod” pretvara u korisni izračun.

Za inženjere infrastrukture sustav se može promatrati kao „pametni cache” – umjesto da pohranjuje točne odgovore, uči obrasce i sve bolje predviđa što će veliki model izreći. Posebno se ističu dvije primjene: treninzi pojačanim učenjem (RL), gdje se politika stalno mijenja, i brzorastuća korporativna okruženja u kojima se chatbotovi pretvaraju u alate za pisanje koda, automatizaciju računovodstva ili upravljanje sustavima.

ATLAS je već aktiviran na namjenskim krajnjim točkama Together AI-ja bez dodatne naknade za više od 800 000 registriranih developera. Šire gledano, najava signalizira zaokret cijele industrije: softverske adaptivne tehnike na standardnom hardveru sve češće sustižu, pa i nadmašuju specijalizirana rješenja, što bi moglo dramatično preusmjeriti ulaganja u AI infrastrukturu.

#nvidia#atlas#together-ai#tri-dao#ben-athiwaratkun
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

CUDA potvrđuje da je Nvidia prije svega softverska tvrtka
Analiza otkriva kako je vlasnička platforma CUDA postala ključan obrambeni mehanizam Nvidije, osiguravši joj dominaciju nad AMD-om i Intelom u utrci za najbrže AI čipove.

min čitanja

Više

Tehnologija

Pantheon gura Topusko u novu energetsku ligu
Giga podatkovni centar u Topuskom traži 1 GW snage, gradi 500 MW solara i 280 km dalekovoda te obećava trajno jačanje hrvatske mreže bez tereta za potrošače.

min čitanja

Više

Tehnologija

Protostar Labs: prvi hrvatski software u svemiru
Osječko-zagrebačka tvrtka u pet je godina dogurala do suradnje s ESA-om i sustava za detekciju anomalija na satelitu OPSAT-1, postavši prva hrvatska kompanija s vlastitim softverom u orbiti.

min čitanja

Više

Tehnologija

Nadella, Sutskever i Taylor svjedočili u završnici procesa Musk protiv OpenAI-ja
Suđenje kojem je Elon Musk suprotstavio OpenAI i Microsoft primaknulo se kraju nakon svjedočenja Satyje Nadelle, Ilye Sutskevera i Breta Taylora.

min čitanja

Više

Tehnologija

Kvantno računarstvo stiže u Split: Ema Puljak otkriva tehnologiju budućnosti
Dr. sc. Ema Puljak 13. svibnja na FESB-u predstavlja praktične aspekte kvantnog računarstva i njegove učinke na sigurnost podataka, AI i kriptografiju.

min čitanja

Više

Tehnologija

Satirična arkadna igra ruga se „Trumpovom“ ratu s Iranom
Tri arkadna ormarića satirične video-igre „Operation Epic Furious: Strait to Hell“ pojavila su se u Washingtonu, nudeći igračima nemoguću misiju Donalda Trumpa u Iranu i raskrinkavanje „pikseliziranog patriotizma“.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

FERIT i FTN zajednički jačaju kibernetičku sigurnost pametne mobilnosti
Projekt CySafe SmartMob vrijedan 823 tisuće eura uspostavlja laboratorije za zaštitu autonomnih vozila i pametnih semafora od hakerskih napada.

min čitanja

Više

Tehnologija

iOS 26.5 donosi šifrirane „zelene balončiće” između iPhonea i Androida
Najnovija nadogradnja iOS-a uvodi end-to-end enkripciju za RCS poruke između iPhonea i Androida, čime Apple prvi put šifrira i „zelene balončiće”.

min čitanja

Više

Tehnologija

U Opatiji se sprema STEP-AI Forum: umjetna inteligencija izlazi iz laboratorija i ulazi u gospodarstvo
STEP-AI Forum, dio MIPRO-a 2026, 27. svibnja okuplja europske institucije i tehnološke lidere u Opatiji kako bi povezali strategiju umjetne inteligencije s njezinom konkretnom primjenom u gospodarstvu.

min čitanja

Više

Tehnologija

Opatija krajem svibnja postaje pop-kulturno čvorište regije
Gaming elite, 60 sati glazbe i filma te vrhunski predavači stižu u Opatiju od 28. do 31. svibnja.

min čitanja

Više

Najčitanije

Tenis

Prižmić stao u Rimu, ali ostavio snažan dojam
Mladi Splićanin zaustavljen je u osmini finala, no pobjeda nad Đokovićem i niz impresivnih mečeva u Rimu nagovještavaju blistavu budućnost.
By Andymiah - File:Novak_Djokovic_Paris_2024_Olympic_Games.jpg, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=163990992

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Vijesti

Splitskim vatrogascima uručen 471 komplet nove opreme za nadolazeću požarnu sezonu

Vijesti

Majica s velikosrpskim simbolima na granici ga koštala 2.000 eura i protjerivanja

Politika

Biskupska komisija: onemogućavanje hrvatskog legitimiteta u BiH je „etnički aparthejd”

Vijesti

Riječka knjižnica ugostila godišnjak koji čuva sportska sjećanja

Sport

Kvar autobusa zaustavio Nehaj: susret s Rudarom odgođen

Lifestyle

Četvrti Panonski festival knjige pretvara osječki Gradski vrt u književnu pozornicu

Vijesti

Stručnjaci smiruju: izbijanje hantavirusa na kruzeru neće prerasti u globalnu prijetnju

Sport

Sergio Ramos ulazi u vlasničku strukturu Seville za 400 milijuna eura

Vijesti

Medicinska škola Rijeka otvara vrata budućim srednjoškolcima

Politika

Labinski gradonačelnik zahvalio sestrama: „Vaš posao je poziv sa srcem”

Vijesti

Srednjoškolka Mate Blažine osvojila drugo mjesto na natječaju SFERICE