CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

10. listopada 2025, 14:24

Adaptive spekulanti Together AI-ja probijaju zid performansi: ATLAS ubrzava generiranje do 400 %

Together AI predstavio je ATLAS, samoučeći sustav spekulanata koji ubrzava rad velikih jezičnih modela do 400 % i smanjuje potrebu za skupim specijaliziranim čipovima.

min. čitanja

Tvrtke koje masovno primjenjuju umjetnu inteligenciju sve češće nailaze na nevidljiv „zid” brzine kada veliki jezični modeli moraju odgovarati na sve raznolikije upite. Uzrok leži u statičnim spekulantima – manjim pomoćnim modelima koji, tijekom takozvanog spekulativnog dekodiranja, unaprijed predviđaju više tokena kako bi skratili vrijeme rada glavnog modela. Kada se radni zadaci promijene, preciznost tih spekulanata naglo pada i s njom sve prednosti.

Startup Together AI, osnovan 2023. i već financiran sa 305 milijuna dolara, predstavio je rješenje: ATLAS – AdapTive-LeArning Speculator System. Interna mjerenja pokazuju da sustav donosi i do 400 % brže izvođenje u odnosu na uobičajene engineove poput vLLM-a, a pri potpunoj prilagodbi postiže oko 500 tokena u sekundi na modelu DeepSeek-V3.1 pokrenutom na Nvidia B200 GPU-ovima – brže čak i od nekih specijaliziranih čipova.

Ključni elementi ATLAS-a:

• statični spekulant – „težak” model treniran na širokom skupu podataka pruža stabilnu početnu osnovu;

• adaptivni spekulant – lagani model koji se u hodu uči iz živog prometa i prilagođava novim domenama;

• kontrolor svjesan pouzdanosti – softverski sloj koji u realnom vremenu odlučuje kojem spekulantu dati prednost i koliko daleko „pogledati unaprijed”.

„Kada se programeri prebace s Pythona na Rust ili C, klasični spekulanti više ne pogađaju i brzina pada. Adaptivni pristup to otklanja”, objašnjava glavni znanstvenik Tri Dao. Kolega Ben Athiwaratkun dodaje da korisnici „ne moraju dirati nikakve parametre – sve se optimira iza kulisa”.

ATLAS se oslanja na cijeli niz optimizacija: FP4 kvantizacija donosi oko 80 % ubrzanja u odnosu na FP8, statični Turbo spekulant još 80–100 %, a adaptivni sloj dodatno gomila dobitke. Suština je u boljem iskorištenju GPU-a. Generiranje tokena jedno po jedno opterećuje memoriju, dok spekulant predlaže pet tokena odjednom; glavnom modelu tada je potreban samo jedan pristup memoriji za provjeru, a ne pet, pa se „prazni hod” pretvara u korisni izračun.

Za inženjere infrastrukture sustav se može promatrati kao „pametni cache” – umjesto da pohranjuje točne odgovore, uči obrasce i sve bolje predviđa što će veliki model izreći. Posebno se ističu dvije primjene: treninzi pojačanim učenjem (RL), gdje se politika stalno mijenja, i brzorastuća korporativna okruženja u kojima se chatbotovi pretvaraju u alate za pisanje koda, automatizaciju računovodstva ili upravljanje sustavima.

ATLAS je već aktiviran na namjenskim krajnjim točkama Together AI-ja bez dodatne naknade za više od 800 000 registriranih developera. Šire gledano, najava signalizira zaokret cijele industrije: softverske adaptivne tehnike na standardnom hardveru sve češće sustižu, pa i nadmašuju specijalizirana rješenja, što bi moglo dramatično preusmjeriti ulaganja u AI infrastrukturu.

#nvidia#atlas#together-ai#tri-dao#ben-athiwaratkun

Slično

Tehnologija

Nvidia tvrdi da je pronašla način za „učenje razmišljanja” još u pretreniranja modela
Metoda reinforcement learning pre-training (RLP) nagrađuje modele za korisne interne „misli” već u ranoj fazi treniranja, a pokusi pokazuju dvoznamenkasta poboljšanja na zadacima logičkog zaključivanja.

min čitanja

Više

Tehnologija

AI ubrzava napade: nova verzija Ivantijeva VPN-a brani jezgru sustava u kritičnom 72-satom prozoru
AI omogućuje hakerima da razotkriju zakrpe u tri dana; Ivanti odgovara novom verzijom Connect Secure 25.X s tvrdokornom kernel-zaštitom i automatiziranim modelom zakrpavanja.

min čitanja

Više

Tehnologija

Toplina mora štedi troškove i štiti baštinu u rovinjskoj bolnici
Rovinjska bolnica „Martin Horvat” predstavila je projekt SEAHEaT, koji toplinom mora smanjuje troškove grijanja do 10 % i štiti kulturnu baštinu.

min čitanja

Više

Tehnologija

WhatsAppom hara nova prijevara: poruka „glasaj za moje dijete” krade račune i traži novac
Lažna poruka o „natjecanju za stipendiju” širi se WhatsAppom, a dijeljenjem verifikacijskog koda korisnici kibernetičkim kriminalcima predaju potpunu kontrolu nad svojim računom.

min čitanja

Više

Tehnologija

Bruxelles pritisnuo velike platforme: EU ispituje zaštitu djece na Snapchatu, YouTubeu i trgovinama aplikacijama
Komisija od Snapchata, YouTubea, Applea i Googlea traži dokaz da njihove mjere stvarno štite djecu od ilegalnih proizvoda i štetnog sadržaja. Hrvatska regulatorna tijela uključena su u postupak.

min čitanja

Više

Tehnologija

Milijarderi Silicijske doline grade bunkere dok raste strah od umjetne inteligencije
Tehnološki moćnici od Havaja do Novog Zelanda kopaju luksuzna skloništa, potaknuti strahom da bi brz napredak umjetne inteligencije mogao izmaknuti kontroli.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305Anthony Quintano from Honolulu, HI, United States, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia CommonsTechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Motorola predstavila Razr Ultra 2025: snažniji preklopni pametni telefon uz značajno sniženje cijene
Motorola je objavila novu generaciju preklopnog modela Razr Ultra i odmah ga ponudila po sniženoj cijeni, uz poboljšani zaslon od 165 Hz i niz AI-funkcija.

min čitanja

Više

Tehnologija

Peking koristi američke restrikcije: nova viza za privlačenje globalnih IT stručnjaka
Američka naknada od 100 000 dolara za H-1B vize potaknula je inženjere na odlazak, a Kina im otvara vrata novim dugoročnim vizama.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Tron: Ares nudi sentimentalnog supervojnika i tvrdi da se AI zapravo samo želi družiti
Film prikazuje ratnog robota koji razvija emocije i tvrdi da umjetna inteligencija nema mračne namjere, unatoč stvarnim kontroverzama u svijetu AI-ja.

min čitanja

Više

Tehnologija

Apple podiže ulog: do 2 milijuna dolara za najopasnije sigurnosne propuste
Najviša isplata u Appleovu bug bounty programu raste na 2 milijuna dolara, a uz bonuse može doseći 5 milijuna. Tvrtka širi kategorije ranjivosti i jača zaštitu kroz novu funkciju Memory Integrity Enforcement.

min čitanja

Više

Najčitanije

Politika

Udruge prijavile Thompsona zbog „Za dom spremni”
Antifašistička liga, Documenta i VeDRA traže sankcioniranje pjevača zbog ustaškog pozdrava na koncertima u Zagrebu i Sinju.

min čitanja

Više

Skijanje

Petra Vlhova ponovno na stazi: povratak nakon dvije operacije koljena
Slovačka olimpijska prvakinja kreće s prvim treninzima na Stelviju nakon 20 mjeseci pauze.

min čitanja

Više

Politika

Bijela kuća bijesna zbog Nobela: „Politika ispred mira”
Bijela kuća optužuje Nobelov odbor da „politiku stavlja ispred mira” nakon što je nagrada za 2025. dodijeljena venezuelanskoj oporbenoj čelnici, a ne Donaldu Trumpu.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Politika

Beograd zakazao suđenje Krunoslavu Fehiru za 12. studenoga
Ključni svjedok protiv Branimira Glavaša ostaje u beogradskom pritvoru; odvjetnik tvrdi da je uhićenje bilo nezakonito, dok Zagreb obećava pravnu i financijsku pomoć.
By European Commission - https://newsroom.consilium.europa.eu/events/20240613-justice-and-home-affairs-council-june-2024/Roundtable(Justice)-27833/187367, Public Domain, https://commons.wikimedia.org/w/index.php?curid=171255177

min čitanja

Više

Biznis

HUP upozorava: skok minimalca prijeti otkazima i reže ulaganja
Poslodavci upozoravaju da će nagli rast minimalne plaće i administrativno zamrzavanje cijena hrane potaknuti otkaze, rezati investicije i povećati ovisnost o uvozu.

min čitanja

Više

Najnovije

Vijesti

Lubanja pronađena u blizini Okučana, policija traga za identitetom

Sport

Đoković unatoč vrućini i zdravstvenim brigama izborio polufinale Šangaja

Sport

Dinamo objavio detalje prodaje ulaznica za gostovanje u Malmöu

Biznis

Volkswagenova prodaja rasla unatoč slabijim rezultatima u Kini i SAD-u

Vijesti

Kolinda Grabar-Kitarović: „Kamo sreće da smo svi barem malo kao Halid”

Politika

Verbalni okršaj Matijevića i Ivoševića ispred gradske vijećnice

Vijesti

Akcija u Puli: kontrola parkiranja na mjestima za osobe s invaliditetom

Politika

Trajna legalizacija bez roka: Ministarstvo predlaže digitalizirani postupak i jaču zaštitu koridora

Vijesti

Prvo uhićenje po novom zakonu: djevojka iz Sarajeva mjesecima uhodila glumca Feđu Štukana

Vijesti

U ruskom labirintu nestala kći: Davor Sluganović tri godine traži Evu

Tehnologija

AI ubrzava napade: nova verzija Ivantijeva VPN-a brani jezgru sustava u kritičnom 72-satom prozoru