CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

10. listopada 2025, 14:24

Adaptive spekulanti Together AI-ja probijaju zid performansi: ATLAS ubrzava generiranje do 400 %

Together AI predstavio je ATLAS, samoučeći sustav spekulanata koji ubrzava rad velikih jezičnih modela do 400 % i smanjuje potrebu za skupim specijaliziranim čipovima.

min. čitanja

XFacebookWhatsApp

Tvrtke koje masovno primjenjuju umjetnu inteligenciju sve češće nailaze na nevidljiv „zid” brzine kada veliki jezični modeli moraju odgovarati na sve raznolikije upite. Uzrok leži u statičnim spekulantima – manjim pomoćnim modelima koji, tijekom takozvanog spekulativnog dekodiranja, unaprijed predviđaju više tokena kako bi skratili vrijeme rada glavnog modela. Kada se radni zadaci promijene, preciznost tih spekulanata naglo pada i s njom sve prednosti.

Startup Together AI, osnovan 2023. i već financiran sa 305 milijuna dolara, predstavio je rješenje: ATLAS – AdapTive-LeArning Speculator System. Interna mjerenja pokazuju da sustav donosi i do 400 % brže izvođenje u odnosu na uobičajene engineove poput vLLM-a, a pri potpunoj prilagodbi postiže oko 500 tokena u sekundi na modelu DeepSeek-V3.1 pokrenutom na Nvidia B200 GPU-ovima – brže čak i od nekih specijaliziranih čipova.

Ključni elementi ATLAS-a:

• statični spekulant – „težak” model treniran na širokom skupu podataka pruža stabilnu početnu osnovu;

• adaptivni spekulant – lagani model koji se u hodu uči iz živog prometa i prilagođava novim domenama;

• kontrolor svjesan pouzdanosti – softverski sloj koji u realnom vremenu odlučuje kojem spekulantu dati prednost i koliko daleko „pogledati unaprijed”.

„Kada se programeri prebace s Pythona na Rust ili C, klasični spekulanti više ne pogađaju i brzina pada. Adaptivni pristup to otklanja”, objašnjava glavni znanstvenik Tri Dao. Kolega Ben Athiwaratkun dodaje da korisnici „ne moraju dirati nikakve parametre – sve se optimira iza kulisa”.

ATLAS se oslanja na cijeli niz optimizacija: FP4 kvantizacija donosi oko 80 % ubrzanja u odnosu na FP8, statični Turbo spekulant još 80–100 %, a adaptivni sloj dodatno gomila dobitke. Suština je u boljem iskorištenju GPU-a. Generiranje tokena jedno po jedno opterećuje memoriju, dok spekulant predlaže pet tokena odjednom; glavnom modelu tada je potreban samo jedan pristup memoriji za provjeru, a ne pet, pa se „prazni hod” pretvara u korisni izračun.

Za inženjere infrastrukture sustav se može promatrati kao „pametni cache” – umjesto da pohranjuje točne odgovore, uči obrasce i sve bolje predviđa što će veliki model izreći. Posebno se ističu dvije primjene: treninzi pojačanim učenjem (RL), gdje se politika stalno mijenja, i brzorastuća korporativna okruženja u kojima se chatbotovi pretvaraju u alate za pisanje koda, automatizaciju računovodstva ili upravljanje sustavima.

ATLAS je već aktiviran na namjenskim krajnjim točkama Together AI-ja bez dodatne naknade za više od 800 000 registriranih developera. Šire gledano, najava signalizira zaokret cijele industrije: softverske adaptivne tehnike na standardnom hardveru sve češće sustižu, pa i nadmašuju specijalizirana rješenja, što bi moglo dramatično preusmjeriti ulaganja u AI infrastrukturu.

#nvidia#atlas#together-ai#tri-dao#ben-athiwaratkun

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Nova tehnika omogućuje umjetnoj inteligenciji da sama pronalazi rješenja
Stanford, Nvidia i Together AI osmislili su tehniku TTT-Discover kojom se AI tijekom izvođenja dodatno uči i postiže dvostruko brže rezultate od dosadašnjih ručno optimiziranih rješenja.

min čitanja

Više

Tehnologija

Silicijska dolina opsesivno kupuje talente umjetne inteligencije
Meta, Google i Nvidia od sredine prošle godine potrošili su gotovo 40 milijardi dolara kako bi s tehnologijom preuzeli i timove triju AI start-upova.

min čitanja

Više

Tehnologija

Lažne ponude za posao pretvaraju cloud IAM u prijetnju od 2 milijarde dolara
Istraživanje CrowdStrikea otkriva kako lažni regruteri i zloćudni kodni paketi omogućuju brzi upad u oblačne račune i krađu kriptovaluta vrijednu dvije milijarde dolara.

min čitanja

Više

Tehnologija

Divovske vruće mase ispod Zemljine kore mijenjaju magnetsko polje već 265 milijuna godina
Dvjema masivnim, ultravrućim zonama u Zemljinom plaštu znanstvenici pripisuju nastanak današnje asimetrije magnetskog polja i stabilnost nekih njegovih dijelova kroz stotine milijuna godina.

min čitanja

Više

Tehnologija

Skrivene kamere u kineskim hotelima: par izložen na pornografskom kanalu
Par je nakon povratka iz Kine na internetu pronašao snimku vlastitog boravka u hotelskoj sobi, što je otkrilo rastući problem skrivenih kamera i trgovine „špijunskom pornografijom”.

min čitanja

Više

Tehnologija

Mikroplastika otkrivena u ekstra djevičanskom maslinovom ulju
Studija Sveučilišta u Firenci pronašla je mikroplastiku u svim testiranim uzorcima ekstra djevičanskog maslinovog ulja, s većim koncentracijama u proizvodima široke distribucije nego u lokalnim uljima.

min čitanja

Više

Tehnologija

OpenAI lansirao GPT-5.3-Codex: novi rekordi na AI testovima kodiranja
GPT-5.3-Codex postavio je nove rekorde na ključnim mjerilima i otvorio frontalni okršaj OpenAI-ja i Anthropica na tržištu AI alata za programere.

min čitanja

Više

Tehnologija

Nema pregovora s hakerima: Istarska županija odbacuje tvrdnje o otkupnini
Na sjednici Županijske skupštine ponovno se raspravljalo o prosinačkom hakerskom napadu; županijski pročelnik Ivan Glušac poručio da nije bilo pregovora s napadačima ni zahtjeva za otkupninom.

min čitanja

Više

Tehnologija

Kibernetički napad paralizirao dio sustava Pula Herculanee
Noćni hakerski napad na informacijski sustav tvrtke uzrokovao je poteškoće u korisničkim službama, a stručni timovi rade na hitnom oporavku sustava.

min čitanja

Više

Tehnologija

Juno otkrio: Jupiter ipak nešto manji nego što se mislilo
Sonda Juno izmjerila je Jupiterov promjer s neviđenom preciznošću i pokazala da je planet nešto spljošteniji i manji nego što su govorile stare procjene.

min čitanja

Više

Najčitanije

Nogomet

By Interbrand – Global Brand Consultancy / Juventus Football Club SpA - Own work based on: Juventus FC 2017 logo.svg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=74445479

Pašalićev bli­ts-povratak: golom za dvije minute zapečatio prolaz Atalante protiv Juventusa
Atalanta je s 3-0 svladala Juventus i ušla u polufinale Kupa, a povratnik Mario Pašalić zabio je svega dvije minute nakon ulaska u igru.

min čitanja

Više

Košarka

By The logo is from the following website: https://www.realmadrid.com/, Fair use, https://en.wikipedia.org/w/index.php?curid=35239667

Dubai iznenadio Real, solidna partija Hezonje
Dubai je u 27. kolu Eurolige svladao Real Madrid 93-85; Mario Hezonja ubacio je 11 poena uz pet asistencija.

min čitanja

Više

Najnovije

Vijesti

U Vukovaru pokopana Verica Rapčak, majka koja je život provela tražeći sina

Lifestyle

Crveni nosovi traže nova pojačanja: audicija za splitski tim 16. veljače

Vijesti

Obitelj u Toskani otrovana ugljikovim monoksidom, preživio jedino očev brat

Lifestyle

„Mali princ” pleše na pozornici Zajca: baletna čarolija za djecu i odrasle

Biznis

Nedostatak radnika pritišće turizam: hotelijeri traže još 5.000 sezonaca

Tehnologija

Lažne ponude za posao pretvaraju cloud IAM u prijetnju od 2 milijarde dolara

Vijesti

Stanovnici Ulice Tina Ujevića traže kameru: „Kad padne mrak, samo čujete fiju, fiju”

Biznis

Braća Saran: od Kaštela do Istanbula, dvojac koji preoblikuje Dalmaciju i turski sport

Biznis

Voda postaje luksuz: Ličke vode poskupjele i do 123 posto

Politika

Norveška policija otvorila istragu protiv bivšeg premijera Jaglanda zbog veza s Epsteinom

Politika

Širenje prava na osobnu asistenciju stiže pred Sabor