CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

30. kolovoza 2025, 06:11

Japanski Sakana AI predstavio M2N2: evolucijski algoritam koji spaja modele bez skupe retrenaže

Algoritam Model Merging of Natural Niches japanskog Sakana AI-ja spaja postojeće AI modele u novi, moćniji sustav bez skupe retrenaže, čuvajući raznolikost i kombinirajući komplementarne vještine.

min. čitanja

XFacebookWhatsApp

Japan-ski laboratorij Sakana AI objavio je algoritam Model Merging of Natural Niches (M2N2) koji, po riječima autora, omogućuje da se sposobnosti više specijaliziranih sustava uklope u jedan moćniji model – i to bez klasičnog, skupo plaćenog fine-tuninga.

Modeli se ne treniraju iznova, već se njihovi već naučeni parametri međusobno stapaju. Budući da je postupak „bez gradijenata” i koristi samo prolaze prema naprijed, računalno je znatno jeftiniji od ponovno pokretanog učenja, a pritom nije potrebna ni originalna skupina podataka. Takav pristup, navodi tim, smanjuje rizik od „katastrofalnog zaboravljanja” – gubitka starih vještina pri svladavanju novih zadataka.

Tri evolucijska trika

  1. Nema fiksnih granica. Umjesto da se spajaju cijeli slojevi, M2N2 određuje fleksibilne „točke presjeka” pa, primjerice, u jednom sloju preuzima 30 % parametara iz Modela A i 70 % iz Modela B.
  2. Natjecanje za raznolikost. Algoritam simulira borbu za ograničene resurse te u arhivi čuva modele s jedinstvenim vještinama, a slabije izbacuje. „Zamišljajte to kao spajanje dviju ispitnih skripti – najbolje je ako svaka zna različite odgovore”, pojašnjavaju istraživači.
  3. „Privlačnost” pri uparivanju. Modeli se ne biraju samo po ukupnom rezultatu nego prema tome nadopunjuju li si slabosti: jedan je jak ondje gdje drugi posustaje.

Pokusima do dokaza

• MNIST klasifikacija – M2N2 je iz početka evoluirao neuronske mreže i ostvario najveću točnost u odnosu na ostale metode.

• Spajanje LLM-ova – matematički specijalist WizardMath-7B i agencijski AgentEvol-7B (obojica na arhitekturi Llama 2) udruženi su u jednog agenta koji rješava zadatke GSM8K i WebShop, pokrivajući i računanje i web-navigaciju.

• Difuzijski generator slika – japanski model JSDXL spojen je s trima Stable Diffusion varijantama treniranima na engleskim uputama. Rezultat su fotorealistične slike uz „novonastalu” dvojezičnost: sustav razumije i japanske i engleske upite premda je optimiran samo na japanske opise.

Što to znači za poduzeća?

Autori ističu da bi se, primjerice, LLM za persuasivni prodajni govor mogao stopiti s vizijskim modelom koji očitava reakcije kupaca – i sve raditi u jednom procesu, uz manju latenciju i trošak. M2N2-ov izvorni kod već je dostupan na GitHubu.

Gledajući naprijed, tim vidi „ekosustav koji se neprestano razvija i spaja po potrebi”. No najveća prepreka nije tehnička, nego organizacijska: u svijetu golemih „spojenih modela” složenih od otvorenih, komercijalnih i vlasničkih komponenti, ključni će izazovi biti privatnost, sigurnost i usklađenost s propisima.

#sakana-ai#m2n2#llama-2#stable-diffusion#jsdxl

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

OpenClaw eksplodira: 21.000 javnih instanci i niz kritičnih propusta
Naglo širenje OpenClawa i niz teških ranjivosti izlažu milijune vjerodajnica, dok stručnjaci nude izolirane kontejnere kao privremeni spas.

min čitanja

Više

Tehnologija

Umjetna inteligencija provjerava činjenice, ali psihologija i dalje određuje ishod
Nova istraživanja pokazuju da umjetna inteligencija može masovno provjeravati činjenice, ali bez povjerenja korisnika i razumijevanja psihologije dezinformacije ostaju otporne.

min čitanja

Više

Tehnologija

Hyperchat AI obećava razbiti granice timske komunikacije
Nova platforma kombinira principe rojnih sustava i umjetnu inteligenciju kako bi velikim organizacijama omogućila efikasne, dvosmjerne rasprave u stvarnom vremenu.

min čitanja

Više

Tehnologija

Nuklearni odmak: ambiciozni rok 2035. suočen s golemim kašnjenjima i troškovima
Stručnjaci hladno dočekali najavu da bi Hrvatska imala vlastiti reaktor za devet godina: europski primjeri kasne desetljeće i trostruko premašuju budžete.

min čitanja

Više

Tehnologija

Hrvatska okuplja 128 stručnjaka za nacionalnu strategiju umjetne inteligencije
Radna skupina od 128 stručnjaka izrađuje Nacionalni plan za razvoj umjetne inteligencije koji će usmjeriti hrvatski javni i privatni sektor do 2032. godine.
By European Commission - https://newsroom.consilium.europa.eu/events/20240613-justice-and-home-affairs-council-june-2024/Roundtable(Justice)-27833/187367, Public Domain, https://commons.wikimedia.org/w/index.php?curid=171255177

min čitanja

Više

Tehnologija

Rotacijska bušilica mijenja pogled na tehničku moć drevnog Egipta
Analiza bakrenog svrdla otkrila da su stari Egipćani savladali rotacijsko bušenje puno prije ostalih civilizacija, preispisujući povijest tehnologije.

min čitanja

Više

Tehnologija

Zaprešić otkrio golemo geotermalno ležište: toplina iz dubine mogla bi grijati cijeli grad
Prvo testiranje bušotine kod Zaprešića otkrilo je izuzetno propusno geotermalno ležište, dovoljno snažno da od 2028. godine grije cijeli grad.

min čitanja

Više

Tehnologija

Krvni testovi nude nadu za rano otkrivanje Parkinsonove bolesti
Skandinavski istraživači pronašli su biomarkere Parkinsonove bolesti u krvi, što bi moglo omogućiti dijagnozu godinama prije prvih simptoma.

min čitanja

Više

Tehnologija

Kineski MiniMax lansira M2.5 i ruši cijene vrhunskih jezičnih modela
Startup iz Šangaja tvrdi da novim modelom M2.5 i njegovom Lightning verzijom donosi 95-postotno sniženje troškova generativne umjetne inteligencije.

min čitanja

Više

Tehnologija

Nvidia predstavila DMS: do osam puta manji memorijski trošak zaključivanja velikih jezičnih modela
DMS komprimira KV spremnik LLM-ova, omogućuje dublje „razmišljanje” i do pet puta veći protok korisničkih upita bez gubitka točnosti.

min čitanja

Više

Najčitanije

Politika

Ustavni sud odbio zahtjev o sporu zbog državnog preuzimanja dočeka rukometaša
Sud zaključio da nema osnove za postupak o navodnom kršenju samoupravnih ovlasti Grada Zagreba pri organizaciji dočeka brončanih rukometaša.

min čitanja

Više

Vijesti

Nagla smrt napadača u Sopotu nakon brutalnog nasrtaja na prolaznicu
Muškarac koji je na ulici napao prolaznicu umro je ubrzo nakon što ga je policija svladala; slijedi obdukcija kako bi se utvrdio uzrok smrti.

min čitanja

Više

Ostalo

Fillon Maillet do zlata u sprintu, Legović izborio dohvatnu utrku
Francuz je uzeo olimpijsko zlato u biatlonskom sprintu, a hrvatski junior Matija Legović izborio je mjesto u dohvatnoj utrci.

min čitanja

Više

Politika

Merz u Münchenu: Otvorio se jaz između Europe i SAD-a, vrijeme je za novu transatlantsku suradnju
Njemački kancelar u Münchenu upozorio na "duboki jaz" između Europe i SAD-a zbog američkih kulturnih ratova, ali i pozvao na obnovu povjerenja unutar NATO-a.
Steffen Prößdorf, CC BY-SA 4.0 <https://creativecommons.org/licenses/by-sa/4.0>, via Wikimedia CommonsBy United States Congress - Senate.gov (archived), Public Domain, https://commons.wikimedia.org/w/index.php?curid=128111508

min čitanja

Više

Najnovije

Sport

Laporta podiže tenzije uoči uzvrata: „Ništa tu nije nevino”

Tehnologija

OpenClaw eksplodira: 21.000 javnih instanci i niz kritičnih propusta

Vijesti

Osječka Copacabana blista za 50. rođendan: završetak radova zakazan za 1. lipnja

Politika

Sedam saveznih država na rubu sukoba oko rijeke Colorado

Lifestyle

Logopetkinja koja muca razbija mitove o mucanju

Tehnologija

Umjetna inteligencija provjerava činjenice, ali psihologija i dalje određuje ishod

Politika

ICE ubrzava širenje u SAD-u, planira više od 150 novih ureda

Sport

Čudesni 19-godišnjak Metodej Jilek šokirao konkurenciju i uzeo zlato na 10.000 metara

Biznis

Ruska središnja banka opet srezala kamate, inflaciju vidi kao prolazno ubrzanje

Lifestyle

Dubrovnik pokreće Camino rutu do Međugorja i otvara prilike za lokalne pružatelje usluga

Biznis

Od političkog izgnanstva do poslovnog carstva: kako su Ante i Stipe Dolić izgradili lanac hotela i restorana