Tehnologija

AlphaOne uvodi „gumb” za podešavanje razmišljanja velikih jezičnih modela

Novi okvir AlphaOne dopušta razvijateljima da tijekom inferencije precizno odrede omjer „sporog” i „brzog” razmišljanja LLM-ova, povećavajući točnost i smanjujući računalne troškove.

min čitanja

Istraživači sa Sveučilišta Illinois u Urbana-Champaignu i Kalifornijskog sveučilišta u Berkeleyju predstavili su AlphaOne (α1), okvir koji razvijateljima omogućuje precizno upravljanje načinom na koji veliki jezični modeli (LLM-ovi) razmišljaju tijekom izvođenja. Za razliku od skupog ponovnog treniranja, α1 djeluje isključivo u fazi inferencije, tj. kad model već odgovara na upit.

Glavna ideja: umjesto jednokratnog pojačavanja ili ograničavanja „sporog”, sustav-2 razmišljanja, AlphaOne uvodi parametar alfa – kliznik koji developer može okretati kako bi modelu odmjerio količinu promišljenog razmišljanja. Sustav prije definiranog „α-trenutka” ubacuje naredbu „wait” kako bi potaknuo promišljanje; nakon toga umetne oznaku </think> i preusmjeri model na brzo zaključivanje.

Testovi na trima modelima (1,5 do 32 milijarde parametara) i šest zahtjevnih mjerila iz matematike, programiranja i prirodnih znanosti donijeli su tri ključna zaključka:

  1. Strategija „prvo sporo, zatim brzo” povećava točnost rješenja, i to za prosječno 6,15 % u odnosu na postojeć e metode.
  2. Iako sporo razmišljanje na početku odulji vrijeme, ukupni broj generiranih tokena padne za oko 21 %, pa se smanjuju računalni troškovi.
  3. Učestalije umetanje „wait” tokena dodatno podiže rezultate – znatno više nego što to čine dosadašnje tehnike s povremenim intervencijama.

„Ključ je u strukturiranom prelasku sa sporog na brzo razmišljanje; tako nastaju i bolje i jeftinije inferencije”, poručio je tim AlphaOnea. Kod bi uskoro trebao biti javno objavljen, a integracija se, kako tvrde, svodi na promjenu naziva modela u konfiguracijskoj datoteci.

Za poduzeća koja traže preciznije odgovore na kompleksne upite ili učinkovitiji generirani kod, to znači dvije dobit i: kvalitetniji izlaz i niže troškove rada modela – kombinaciju koju dosadašnji pristupi često nisu mogli pomiriti.

Ostalo

Trumpov rođendanski spektakl: Washington priprema najveću vojnu paradu u svojoj povijesti
Donald Trump obilježava 79. rođendan najvećom vojnom paradom u Washingtonu, dok diljem SAD-a rastu prosvjedi protiv njegove politike.

min čitanja

Više

Papa Lav pozvao Iran i Izrael na razboritost i dijalog
Obraćajući se vjernicima u Bazilici svetog Petra, Papa Lav pozvao je Teheran i Jeruzalem na razboritost i dijalog, ističući da nitko ne smije ugroziti postojanje drugoga.

min čitanja

Više

Modrić nahvalio Alonsa na prvom treningu Reala
Hrvatski kapetan hvali radnu etiku Xabija Alonsa dok Real Madrid cilja naslov na Svjetskom klupskom prvenstvu u SAD-u.

min čitanja

Više

Podolnjak: Sabor, DIP i Ustavni sud pali na ispitu regularnosti izbora
Ustavnopravni stručnjak Robert Podolnjak upozorava da su Sabor, DIP i Ustavni sud zakazali u nadzoru lokalnih izbora, što je narušilo povjerenje građana te zahtijeva hitnu reformu izbornog sustava.

min čitanja

Više

Napad na političare u Minnesoti: Hoffman i Hortman ranjeni u dvostrukoj pucnjavi
Senator John Hoffman i zastupnica Melissa Hortman te njihovi supružnici ranjeni su u dvjema odvojenim pucnjavama u Minnesoti; policija traga za napadačem.

min čitanja

Više

Brozović na pragu spektakularnog preseljenja: Al Hilal nudi ugovor života
Najbogatiji saudijski klub Al Hilal nudi Marcela Brozoviću gotovo dvostruko veći ugovor od sadašnjeg u Al-Nassru, dok Al Shabab iz prikrajka vreba svoju priliku.

min čitanja

Više

Izraelski udar na Iran zbližio političke rivale i učvrstio Netanyahua
Izraelski zračni i kibernetički udari na Iran ujedinili su izraelsku politiku, produbili pritisak na Teheran i privremeno ojačali položaj premijera Benjamina Netanyahua.

min čitanja

Više

Ružić na korak do glavnog ždrijeba Nottinghama
Antonia Ružić svladala Varvaru Lepchenko i izborila finale kvalifikacija WTA turnira u Nottinghamu.

min čitanja

Više

David Beckham dobio titulu viteza u godišnjoj kraljevoj listi
Bivši kapetan Engleske primio je najviše britansko odlikovanje koje nosi naslov „Sir”.

min čitanja

Više

Njemačka najavljuje povratak 17.000 azilanata, Jurić upozorava na demografsku preobrazbu Hrvatske
Njemačka planira vratiti 17 000 tražitelja azila u Hrvatsku; demograf Tado Jurić upozorava da bi taj val, zajedno s trajnim ostankom većine ukrajinskih izbjeglica, mogao dramatično promijeniti hrvatsko društvo i tržište rada.

min čitanja

Više