CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

23. veljače 2026, 20:26

Istraživači ubrzali „chain of thought”: novi model predviđa više tokena u jednom koraku

Novi pristup višestrukom predviđanju tokena ubrzava jezične modele do tri puta uz minimalan pad točnosti, tvrde istraživači iz SAD-a.

min. čitanja

XFacebookWhatsApp

Tim sa Sveučilišta Maryland, Lawrence Livermore National Laboratoryja, Sveučilišta Columbia i startup-a TogetherAI predstavio je tehniku višestrukog predviđanja tokena (multi-token prediction, MTP) koja ubrzava rad jezičnih modela do tri puta, a pritom zahtijeva samo jedan dodatni „specijalni” token u arhitekturi.

Tradicionalni modeli generiraju tekst po principu „sljedeći token”, što znači da se za svaku riječ ili znak pokreće zaseban prolaz kroz mrežu. Kada modeli moraju ispisati tisuće tokene za detaljne chain-of-thought odgovore, to pretvara latenciju u skupi usko grlo. Nova metoda omogućuje da se cijeli blok tokena izračuna u jednom prolazu, čime se dramatično skraćuje vrijeme čekanja za krajnjeg korisnika.

Ključni izazov MTP-a leži u očuvanju gramatičke koherentnosti. Ako se svaki od, primjerice, pet tokena predviđa neovisno, nastaju konstrukcije poput „panda meso” ili beskonačno ponavljanje riječi „the”. Kako bi to izbjegli, istraživači su uveli shemu učenja učenik-mentor:

• Učenik (student) istodobno predloži blok tokena.
• Mentor (teacher) – snažan model treniran klasičnim pristupom – procijeni koliko je prijedlog vjerojatan i smislen te na temelju toga dodjeli gubitak.

Taj proces podsjeća na učenje potkrijepljeno nagradom: povratna informacija nije statična, nego nastaje u hodu iz samih prijedloga učenika, što ga uči izbjegavati nelogične fraze i neželjene ponavljanja.

Da bi ubrzanje u praksi bilo što veće bez velikog udara na točnost, uveden je adaptivni dekoder ConfAdapt. On za svaku iteraciju provjerava samopouzdanje modela; tokeni iznad, primjerice, 90 % sigurnosti prihvaćaju se u paketu, dok se neizvjesni dijelovi teksta generiraju klasično, token po token.

Na modelu Llama-3.1-8B prilagođenom na matematičkom skupu MetaMathQA postignuto je trostruko ubrzanje uz manje od tri posto pada točnosti. Kompaktniji Qwen3-4B dosegnuo je isti faktor ubrzanja uz oko sedam posto kompromisa. U agresivnijim postavkama mogući su i petostruki dobitci, ali uz veći gubitak preciznosti.

Istraživanje je pokazalo da se dobitci prelijevaju i na zadatke koji nisu bili dio faze treniranja, poput kreativnog pisanja ili sažimanja. Unatoč tome, autori savjetuju organizacijama da svoje domenske upite uključe u dodatnu MTP prilagodbu kako bi dobili optimalnu ravnotežu brzine i kvalitete.

Modeli trenirani prema ovom pristupu već su objavljeni na otvorenoj platformi, a kôd za MTP okvir bit će uskoro dostupan. Inženjerski timovi koji ih integriraju u postojeće sustave trebat će prilagoditi logiku grupiranja zahtjeva i spremanja KV-zapisa – jednokratni trošak, kako navode autori, bez dugoročnih prepreka.

„Očekujemo da će produkcijska implementacija naše metode pojednostaviti razvoj brzih, agentskih modela niske latencije, jer dio složenosti više nije na inferencijskoj infrastrukturi nego ugrađen izravno u težine modela”, poručio je suautor istraživanja John Kirchenbauer.

#sveuciliste-columbia#sveuciliste-maryland#lawrence-livermore#togetherai#john-kirchenbauer
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Novi opoziv Cybertrucka: Teslinu „neuništivom” pick-upu prijeti ispadanje kotača
Tesla opoziva još 173 Cybertrucka jer pogrešna mast može uzrokovati pucanje kočionih diskova i otpadanje kotača, što je već jedanaesta greška na kontroverznom električnom pick-upu.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Porečki poduzetnici otkrivali alate umjetne inteligencije za unaprjeđenje poslovanja
Besplatna radionica u Poreču pokazala poduzetnicima kako AI može ubrzati marketing, prodaju i izradu web stranica.

min čitanja

Više

Tehnologija

Bostromov riskantni optimizam: umjetna inteligencija kao put prema čovjekovoj „mirovini od smrti”
Filozof Nick Bostrom tvrdi da je mala šansa AI-apokalipse prihvatljiva ako strojevi omoguće ljudsku besmrtnost, čime je okrenuo ploču na svoja ranija, puno mračnija upozorenja.

min čitanja

Više

Tehnologija

Trideset godina tehnološke strasti: Zajednica tehničke kulture PGŽ slavi jubilej
Zajednica tehničke kulture Primorsko-goranske županije proslavila je 30. rođendan uz naglasak na brzi tehnološki razvoj, rad s djecom i programe cjeloživotnog učenja.

min čitanja

Više

Tehnologija

Pametni ormarići s loptama stigli u Rijeku
Studentski startup Unlokie instalirao je pametne ormariće za posudbu lopti u Rijeci: skeniranje QR koda, 30 sekundi i lopta je vaša za 65 centi.

min čitanja

Više

Tehnologija

Belgija podiže prvi svjetski energetski otok u Sjevernom moru
Otok princeze Elizabete objedinit će 2,1 GW vjetroenergije, stajati više od milijardu eura i ujedno služiti kao morsko utočište za ptičji i podvodni svijet.

min čitanja

Više

Tehnologija

Mexički znanstvenici iz otrova škorpiona i habanera stvaraju nova oružja protiv superbakterija
UNAM-ovi timovi sintetizirali su antibiotike iz otrova škorpiona Diplocentrus melici i habanero papričice, učinkovite protiv tuberkuloze, zlatnog stafilokoka i Pseudomonas aeruginosa te već osigurali patente u Meksiku.

min čitanja

Više

Tehnologija

Kina planira kontejneraš na torij: deset godina plovidbe bez kapi goriva
Peking najavljuje kontejneraš na rastaljenu sol koji bi bez nadopune goriva plovio deset godina te mogao dramatično smanjiti emisije, ali ga čekaju golemi regulatorni i ekonomski izazovi.

min čitanja

Više

Tehnologija

I pod dubokom anestezijom mozak „sluša” i predviđa riječi
Novo istraživanje pokazuje da ljudski mozak pod anestezijom i dalje obrađuje govor, raspoznaje neuobičajene zvukove i čak predviđa sljedeće riječi.

min čitanja

Više

Tehnologija

PEF tehnologija nudi skok u randmanu maslinova ulja bez gubitka kvalitete
Švedska PEF tehnologija obećava do 15 % veći randman i bogatiji aromatski profil maslinova ulja, a hrvatski uljari sve je češće razmatraju kao investiciju u konkurentnost.

min čitanja

Više

Najčitanije

Futsal

Zbog futsala na Trsatu privremene zabrane prometovanja
Prvo polufinale SuperSport HMNL-a donosi zatvaranje nekoliko ulica oko Dvorane mladosti u subotu od 18 sati.

min čitanja

Više

Vijesti

Supetarska gradonačelnica o napadu na Vukovića: prijetnje ne smiju postati normalne
Gradonačelnica Supetra osudila je fizički napad na novinara Sinišu Vukovića na splitskoj Rivi i pozvala građane da prijavljuju sve prijetnje.

min čitanja

Više

Politika

Plenković u Novoj Gradiški: HDZ-ovi kandidati nude stabilnost i razvoj
Premijer Andrej Plenković u Novoj Gradiški podržao HDZ-ove kandidate Bernardina Trnku i Brunu Bušića, naglasivši nužnost stabilnog vodstva i nastavka razvojnih projekata.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Vijesti

Riječka onkologija skraćuje terapiju raka dojke na pet dana
KBC Rijeka prvi u Hrvatskoj uvodi FAST-Forward protokol: radioterapija raka dojke završava za samo pet dana uz jednaku učinkovitost i manje nuspojava.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Kvarner u Zagrebu protiv Cibone lovi posljednji vlak za doigravanje

Sport

Vrhunac drame u Trećoj NL Istok: Marsonia vreba povratak na vrh

Sport

Klapa HRM-a „Sveti Juraj” pjesmom podiže moral Vatrenima

Vijesti

Dvostruka akcija HGSS-a Split: isti dan spašene dvije ozlijeđene turistkinje

Sport

Riječki boksač Ramljak u polufinalu državnog prvenstva

Politika

Ivošević optužio Šutu: grad ignorira napade na novinare

Vijesti

Skele oko Tuđmanova spomenika: redovito održavanje traje do 15. svibnja

Vijesti

Ronioci najavili čišćenje podmorja uz Sustipan povodom blagdana sv. Duje

Sport

Đakovo Croatia pod pritiskom: derbi začelja protiv Hrvatskog dragovoljca odlučuje sezonu

Sport

Rijeka glatko slavila u Vukovaru i vratila treće mjesto pred finale Kupa

Lifestyle

Renata Lovrinčević Buljan usred Sudamje demonstrirala hitnu „rehabilitaciju”