CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

30. kolovoza 2025, 06:11

Japanski Sakana AI predstavio M2N2: evolucijski algoritam koji spaja modele bez skupe retrenaže

Algoritam Model Merging of Natural Niches japanskog Sakana AI-ja spaja postojeće AI modele u novi, moćniji sustav bez skupe retrenaže, čuvajući raznolikost i kombinirajući komplementarne vještine.

min. čitanja

XFacebookWhatsApp

Japan-ski laboratorij Sakana AI objavio je algoritam Model Merging of Natural Niches (M2N2) koji, po riječima autora, omogućuje da se sposobnosti više specijaliziranih sustava uklope u jedan moćniji model – i to bez klasičnog, skupo plaćenog fine-tuninga.

Modeli se ne treniraju iznova, već se njihovi već naučeni parametri međusobno stapaju. Budući da je postupak „bez gradijenata” i koristi samo prolaze prema naprijed, računalno je znatno jeftiniji od ponovno pokretanog učenja, a pritom nije potrebna ni originalna skupina podataka. Takav pristup, navodi tim, smanjuje rizik od „katastrofalnog zaboravljanja” – gubitka starih vještina pri svladavanju novih zadataka.

Tri evolucijska trika

  1. Nema fiksnih granica. Umjesto da se spajaju cijeli slojevi, M2N2 određuje fleksibilne „točke presjeka” pa, primjerice, u jednom sloju preuzima 30 % parametara iz Modela A i 70 % iz Modela B.
  2. Natjecanje za raznolikost. Algoritam simulira borbu za ograničene resurse te u arhivi čuva modele s jedinstvenim vještinama, a slabije izbacuje. „Zamišljajte to kao spajanje dviju ispitnih skripti – najbolje je ako svaka zna različite odgovore”, pojašnjavaju istraživači.
  3. „Privlačnost” pri uparivanju. Modeli se ne biraju samo po ukupnom rezultatu nego prema tome nadopunjuju li si slabosti: jedan je jak ondje gdje drugi posustaje.

Pokusima do dokaza

• MNIST klasifikacija – M2N2 je iz početka evoluirao neuronske mreže i ostvario najveću točnost u odnosu na ostale metode.

• Spajanje LLM-ova – matematički specijalist WizardMath-7B i agencijski AgentEvol-7B (obojica na arhitekturi Llama 2) udruženi su u jednog agenta koji rješava zadatke GSM8K i WebShop, pokrivajući i računanje i web-navigaciju.

• Difuzijski generator slika – japanski model JSDXL spojen je s trima Stable Diffusion varijantama treniranima na engleskim uputama. Rezultat su fotorealistične slike uz „novonastalu” dvojezičnost: sustav razumije i japanske i engleske upite premda je optimiran samo na japanske opise.

Što to znači za poduzeća?

Autori ističu da bi se, primjerice, LLM za persuasivni prodajni govor mogao stopiti s vizijskim modelom koji očitava reakcije kupaca – i sve raditi u jednom procesu, uz manju latenciju i trošak. M2N2-ov izvorni kod već je dostupan na GitHubu.

Gledajući naprijed, tim vidi „ekosustav koji se neprestano razvija i spaja po potrebi”. No najveća prepreka nije tehnička, nego organizacijska: u svijetu golemih „spojenih modela” složenih od otvorenih, komercijalnih i vlasničkih komponenti, ključni će izazovi biti privatnost, sigurnost i usklađenost s propisima.

#sakana-ai#m2n2#llama-2#stable-diffusion#jsdxl
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Festival znanosti u Rijeci: tjedan dana više od 100 besplatnih događanja o energiji
Rijeka od 20. do 25. travnja domaćin je 24. Festivala znanosti, koji na 30 lokacija nudi više od 100 besplatnih događanja posvećenih energiji.

min čitanja

Više

Tehnologija

Havaji asfaltiraju ceste plastičnim otpadom iz oceana
Havaji pokrenuli projekt recikliranja plastičnog otpada iz oceana u asfalt za lokalne ceste, prvi takve vrste na svijetu.

min čitanja

Više

Tehnologija

Građani u obrani Jadrana: u Splitu predstavljene aplikacije koje svakome otvaraju vrata znanosti
Citizen Science Day u Splitu okupio je pedesetak sudionika i predstavio niz aplikacija koje građanima omogućuju aktivno sudjelovanje u praćenju i zaštiti Jadrana.

min čitanja

Više

Tehnologija

OpenAI lansirao GPT-5.4-Cyber nakon upozorenja konkurenta
Nakon što je Anthropic odlučio zadržati svoj novi AI model pod ključem zbog straha od zlouporabe, OpenAI predstavlja GPT-5.4-Cyber, alat namijenjen kibernetičkim stručnjacima.

min čitanja

Više

Tehnologija

Poljičica prelazi u digitalno doba
U Srinjinama se 17. travnja predstavlja digitalni font Poljičice, staroga pisma proglašenog nematerijalnim kulturnim dobrom 2023. godine.

min čitanja

Više

Tehnologija

Anthropic i OpenAI u klinču zbog kontroverznog prijedloga zakona o odgovornosti AI-a u Illinoisu
Tvrtke su se razišle oko SB 3444, koji bi laboratorije oslobodio odgovornosti za masovne štete izazvane umjetnom inteligencijom.

min čitanja

Više

Tehnologija

Iva Tolić: Stanice nas uče da je obnova srž života
Hrvatska znanstvenica Iva Tolić objašnjava kako neprekidna obnova na staničnoj razini može biti nadahnuće za suočavanje s globalnim krizama.

min čitanja

Više

Tehnologija

Prvi riječki bankomat zaškripio zbog prašine, ali najavio novu eru plaćanja
Podsjetnik na 1986.: riječki bankomat pokvarila je obična prašina, ali je unatoč tome označio početak digitalnog upravljanja novcem.

min čitanja

Više

Tehnologija

NASA-ino superračunalo: sav život na Zemlji nestaje za milijardu godina
Superračunalo NASA-e, analizirajući 400 000 scenarija, prognozira da će širenje Sunca uništiti sav život na Zemlji za otprilike milijardu godina.

min čitanja

Više

Tehnologija

Projektni dan u Splitu otkrio snagu mladih inovatora
Učenici Splitsko-dalmatinske županije na Projektnom danu Centra izvrsnosti predstavili su inovativne projekte, a najavljene su i nove prijave te velike investicije u školsku infrastrukturu.

min čitanja

Više

Najčitanije

Vijesti

Čavle i Kostrena dobile 3,2 milijuna eura za nove društvene centre
Bespovratna sredstva iz ITU programa omogućit će modernizaciju Doma kulture Čavle i gradnju društveno-boćarskog doma u Kostreni, s radovima koji kreću na proljeće.

min čitanja

Više

Tehnologija

Festival znanosti u Rijeci: tjedan dana više od 100 besplatnih događanja o energiji
Rijeka od 20. do 25. travnja domaćin je 24. Festivala znanosti, koji na 30 lokacija nudi više od 100 besplatnih događanja posvećenih energiji.

min čitanja

Više

Vijesti

Riječki maturanti srušili rekord: gotovo 140 doza krvi u dvodnevnoj MatuRijadi
Rekordnih gotovo 140 doza krvi prikupili su maturanti riječkih srednjih škola u dvodnevnoj humanitarnoj akciji MatuRijada.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Politika

Tafra odbacio Olujićeve optužbe o „jednopartijskom režimu”

Politika

Sindikati pozvali na prosvjed: traže veće plaće, mirovine i niže cijene hrane

Lifestyle

Talijanska elegancija u Palači Modello: u Rijeci otvorena izložba kravata Talarico

Lifestyle

Bribirska glavica: slojevita „hrvatska Troja” propada usred Ravnih kotara

Biznis

HUP predviđa rast BDP-a od 2,5 % uz petpostotnu inflaciju

Sport

HNS objavio sudačku analizu 29. kola: pet spornih situacija, Hajduk ne oštećen

Lifestyle

Premijera predstave „Elita” okupila splitsku kulturnu kremu

Politika

Kijev tvrdi: u ožujku vraćeno 50 km², ruske rafinerije pod udarom

Lifestyle

Rijeka otvara Tjedan dobre dječje knjige s više od 50 događanja

Vijesti

Vinkovački srednjoškolac Vjeko Šarić osvojio državno zlato iz biologije

Vijesti

U Puli otvorena konferencija o vodi: regija traži zajednička rješenja za klimatske izazove